أكثر

كيف تجد إحداثيات متوسطة لمجموعة من النقاط من طبقة نقطية في QGIS؟


لدي مجموعة من نقاط التنسيق. يتم توزيع النقاط بطريقة يتم فيها تجميع بعض النقاط حول منطقة معينة. يوجد خيار لمعرفة الإحداثيات المتوسطة (الإحداثيات) لطبقة النقطة بأكملها. أود أن أعرف ما إذا كانت هناك أية طريقة في QGIS لمعرفة متوسط ​​إحداثيات النقاط من منطقة معينة من طبقة نقطية.


تحتاج إلى القيام بذلك في عملية من مرحلتين باستخدام ملفالمتجهات-> أدوات التحليل-> متوسط ​​الإحداثياتأداة في الخطوة الثانية. ستعيد هذه الأداة الإحداثيات المتوسطة لمجموعات من النقاط داخل الطبقة إذا كان لديهم حقل معرف فريد. لذلك ، إذا كان لديك طبقة مضلع تحدد المناطق الخاصة بك ، فقم بعمل صلة مكانية (Vector-> Data Management-> ضم السمات حسب الموقع) لإسناد نقاطك بمعرف المضلع (المنطقة) ثم استخدام أداة الإحداثيات المتوسطة ، مع تحديد الحقل الجديد.

قد يكون لديك بالفعل معرفات فريدة أو طبقة مضلع ولكن إذا لم تفعل ذلك ، يمكنك إنشاء شبكة صيد السمك (Vector-> أدوات البحث-> Vector Grid) لوضع النقاط كطريقة واحدة لتحديد المناطق. بدلاً من ذلك ، إذا تم تحديد مناطقك بواسطة طبقة نقطية ، فيمكنك استخدام الامتدادأخذ العينات النقطيةالمكون الإضافي لإسناد النقاط بناءً على البيانات النقطية. أو ، إذا كنت تريد أن تنسبها حسب الموقع بدون طبقة متجه أو نقطية ، فستحتاج إلى إنشاء خوارزمية لإعطاء سمة جديدة بناءً على إحداثيات كل نقطة (ربما باستخدام نهج قائم على المعامل).


النقاط في الإحداثيات وملف الأشكال بالقدم - لا تحاذي & # 39t حتى في نفس الإسقاط

أحاول تشغيل عدد النقاط في المضلع في QGIS. لدي ملف أشكال من الرموز البريدية في سان دييغو في NAD83 (2230 EPSG). لدي ملف نصي محدد بالنقاط مع إحداثيات خطوط الطول / العرض.

في QGIS ، يمكنني الحصول على النقاط لتتراكب بشكل صحيح على المضلعات في العارض في إسقاط OTF الأساسي. لكن لا يمكنني تشغيل عدد النقاط في المضلع أثناء وجودهم في إسقاطات مختلفة. لقد أعدت إسقاط كل ملف (حفظ النقاط كملف أشكال) مع إسقاطات متطابقة في QGIS ، لكن المناطق الجغرافية لا تتطابق على الإطلاق.

أفترض أن مشكلتي هي أن إحداثيات خطوط الطول / العرض بالدرجات وأن الإسقاط NAD83 بالقدم. اعتقدت أن إعادة الإسقاط من شأنه أن يحل هذه المشكلة؟ من الواضح أنه يمكن قراءة الملفات معًا بسهولة ، فهي تظهر في المكان المناسب في العارض باستخدام إسقاط OTF. يعمل هذا فقط مع CRS المخصص الافتراضي لـ OTF الذي يبدو أنه يتعامل مع تعارض ft / lat-lon. إذا قمت بحفظ الكل في طبقة WGS مثل EPSG4326 أو EPSG3857 فلا شيء تتم محاذاة.


الملخص

لا يمكن المبالغة في أهمية التحسين. يتم الاعتماد عليها حرفيًا أو مسؤولة عن الكثير مما نراه ونفعله على أساس يومي ، مع العديد من أنظمة الخدمة المصممة والمدارة لتقديم أفضل أداء ممكن. تسلط ورقة المراجعة هذه الضوء على زيادة تطبيق التحسين من خلال أنظمة المعلومات الجغرافية (GIS) لدعم الإدارة واتخاذ القرار. هناك تصور واسع في دوائر علوم الإدارة والتحسين هو أن نظم المعلومات الجغرافية هي مجرد نظام قاعدة بيانات يسهل الوصول إلى البيانات ورسم الخرائط والتحليل الموجز. ومع ذلك ، فإن التحسين متاح بالفعل من خلال الوظائف الأساسية في العديد من حزم نظم المعلومات الجغرافية. تحدد هذه المراجعة العديد من إمكانيات التحسين المتاحة في نظم المعلومات الجغرافية ، وهي مهمة لأن هناك اتجاهًا ثابتًا ومتزايدًا للنشر في المنافذ الأكاديمية وغيرها من المنافذ التي تقدم تقارير عن جهود التطبيق التي تعتمد على التحسين المستند إلى نظم المعلومات الجغرافية. يتم تسهيل استخدام نظم المعلومات الجغرافية عن طريق الوصول سهل الاستخدام بالتأشير والنقر. وهذا بلا شك يفسر زيادة التخطيط الإداري الذي يشمل نظم المعلومات الجغرافية ، مما يجعل هذه المراجعة مهمة لأسباب عديدة. يُترجم توافر أدوات وتقنيات التحسين في نظم المعلومات الجغرافية إلى الاستخدام ، غالبًا من قبل الأفراد الذين من المحتمل ألا يفهموا النماذج والأساليب الأساسية. إن الأهمية المتزايدة لبرمجيات نظم المعلومات الجغرافية المعاصرة كوسيط تحليلي للإدارة والأعمال تجعل هذا موضوع مراجعة هامًا وفي الوقت المناسب ، وتشير إلى أن الاهتمام المتزايد بالقدرات المتوفرة في نظم المعلومات الجغرافية أمر ضروري لضمان تطبيق أساليب التحسين بشكل مناسب وذات مغزى في الممارسة. .


تنزيل البيانات كملف CSV¶

  1. قم بتنزيل البيانات بتنسيق CSV بمجرد جمع أي بيانات. بعد إرسال النماذج النهائية ، انتقل إلى قائمة الإعدادات وحدد "المشاريع" وانقر على المشروع الذي ترغب في تنزيله كملف CSV.

  1. ضمن "تحديد نوع التصدير" ، انقر على "CSV (قديم)" في القائمة المنسدلة. يمكنك أيضًا تغيير تنسيق القيمة والعنوان إلى قيم ورؤوس XML.

  1. حدد الروابط الموجودة أسفل "اسم الملف". يجب تنزيل البيانات كملف اكسل. افتح البيانات في Excel. يجب أن يكون لكل سؤال عمود. مع الإجابة في الخلية أدناه.

  1. يحول ملف CSV البيانات إلى ملف نصي يمكن تسميته بنقطتي x و y. يمكن تحميل هذه النقاط في جدول إلى QGIS الذي سيرسم البيانات لك.

استيراد ملفات CSV إلى QGIS¶

  1. في مربع الحوار "إنشاء طبقة من ملف نصي محدد" ، انقر فوق "استعراض" لتحديد مسار الملف النصي الذي قمت بتنزيله. أضف اسم طبقة. في قسم "تنسيق الملف" ، حدد "محددات مخصصة" وحدد "علامة تبويب". سيتم ملء قسم "تعريف الهندسة" تلقائيًا إذا عثر على حقلي إحداثي X و Y مناسبين. في حالتنا هم LONGITUDE و LATITUDE. يمكنك تغييره إذا حدد الاستيراد الحقول الخاطئة. انقر فوق موافق.

  1. سيطلب منك محدد النظام المرجعي المنسق تحديد نظام مرجعي إحداثي. نظرًا لأن الإحداثيات تقع في خطوط الطول والعرض ، يجب عليك تحديد WGS 84.

تنزيل النماذج من حساب¶

  1. انقر فوق المشروع في صفحة KoBoToolbox الرئيسية وحدد "تطبيق Android" ضمن "جمع البيانات".

  1. افتح أو ثبّت التطبيق على جهاز Android. يُطلق على التطبيق اسم KoBo Collect. يجب أن يكون الشعار مشابهًا للشعار أدناه.

  1. انتقل إلى خيار الإعدادات العامة في أعلى يمين التطبيق المفتوح. انقر فوق "الخادم" وأدخل عنوان URL المقدم عبر الإنترنت ومعلومات تسجيل الدخول الخاصة بك.

  1. اكتب اسم المستخدم وكلمة المرور لحساب kobotoolbox على الصفحة المنبثقة. حدد "KoBo Toolbox" كمنصة.

  1. سيتم عرض قائمة بجميع النماذج من المشاريع المختلفة. انقر فوق Toggle All (أو حدد العناصر التي ترغب في تنزيلها) ، ثم انقر فوق Get Selected.


تحدد هذه الأداة مجموعات مكانية ذات دلالة إحصائية من القيم العالية (النقاط الساخنة) والقيم المنخفضة (النقاط الباردة). يقوم بإنشاء فئة ميزات الإخراج مع حقل خانة z-Score ، و p-value ، ومستوى الثقة (Gi_Bin) لكل ميزة في فئة ميزات الإدخال.

تعد درجات z والقيم p مقاييس ذات دلالة إحصائية تخبرك بما إذا كنت سترفض الفرضية الصفرية أم لا ، ميزة تلو الأخرى. في الواقع ، يشيرون إلى ما إذا كان التجميع المكاني المرصود للقيم العالية أو المنخفضة أكثر وضوحًا مما يتوقعه المرء في التوزيع العشوائي لتلك القيم نفسها. لا يعكس حقلا z-Score و p-value أي نوع من تصحيح FDR (False Discovery Rate).

يحدد حقل Gi_Bin النقاط الساخنة والباردة ذات الدلالة الإحصائية بغض النظر عما إذا كان تصحيح FDR مطبقًا أم لا. تعكس الميزات الموجودة في حاويات +/- 3 دلالة إحصائية مع ميزات مستوى ثقة بنسبة 99 بالمائة في حاويات +/- 2 تعكس ميزات مستوى الثقة بنسبة 95 بالمائة في حاويات +/- 1 مستوى ثقة بنسبة 90 بالمائة وتجميع الميزات في bin 0 ليست ذات دلالة إحصائية. بدون تصحيح FDR ، تعتمد الأهمية الإحصائية على حقلي p-value و z-Score. عندما تتحقق من المعلمة الاختيارية Apply False Discovery Rate Correction (FDR) التصحيح ، يتم تقليل قيم p الحرجة التي تحدد مستويات الثقة لحساب الاختبارات المتعددة والاعتماد المكاني.

تشير درجة z العالية وقيمة p الصغيرة لميزة إلى تجميع مكاني للقيم العالية. تشير الدرجة z السلبية المنخفضة والقيمة p الصغيرة إلى تجمع مكاني للقيم المنخفضة. كلما زادت (أو أقل) درجة z ، زادت كثافة التجمع. تشير الدرجة z القريبة من الصفر إلى عدم وجود تجمع مكاني ظاهر.

تعتمد درجة z على حساب فرضية العدم العشوائية. لمزيد من المعلومات حول z-scores ، راجع ما هو z-Score؟ ما هي القيمة الاحتمالية؟

عندما لا يتم عرض فئة ميزات الإدخال (أي عندما يتم إعطاء الإحداثيات بالدرجات والدقائق والثواني) أو عندما يتم تعيين نظام إحداثيات الإخراج على نظام إحداثيات جغرافي ، يتم حساب المسافات باستخدام القياسات الوترية. تُستخدم قياسات المسافة الوترية لأنه يمكن حسابها بسرعة وتوفر تقديرات جيدة جدًا للمسافات الجيوديسية الحقيقية ، على الأقل للنقاط التي تقع ضمن حوالي 30 درجة من بعضها البعض. تستند المسافات الوترية على شكل كروي مفلطح. بالنظر إلى أي نقطتين على سطح الأرض ، فإن المسافة الوترية بينهما هي طول الخط الذي يمر عبر الأرض ثلاثية الأبعاد لربط هاتين النقطتين. يتم الإبلاغ عن المسافات الوترية بالمتر.

حذر:

تأكد من عرض بياناتك إذا كانت منطقة الدراسة الخاصة بك تتجاوز 30 درجة. المسافات الوترية ليست تقديرًا جيدًا للمسافات الجيوديسية التي تتجاوز 30 درجة.

عند استخدام المسافات الوترية في التحليل ، يجب تحديد نطاق المسافة أو معلمة المسافة العتبة ، إذا تم تحديدها ، بالأمتار.

بالنسبة لميزات الخط والمضلع ، يتم استخدام النقط الوسطى للميزات في حسابات المسافة. بالنسبة للنقاط المتعددة ، أو الخطوط المتعددة ، أو المضلعات ذات الأجزاء المتعددة ، يتم حساب النقطه الوسطى باستخدام مركز المتوسط ​​الموزون لجميع أجزاء الميزة. الترجيح للمعالم النقطية هو 1 ، أما بالنسبة إلى معالم الخط فهو الطول ، والمعالم المضلعة هي المنطقة.

يجب أن يحتوي حقل الإدخال على مجموعة متنوعة من القيم. تتطلب الرياضيات الخاصة بهذا الإحصاء بعض التباين في المتغير الذي يتم تحليله ولا يمكن حله إذا كانت جميع قيم الإدخال 1 ، على سبيل المثال. إذا كنت ترغب في استخدام هذه الأداة لتحليل النمط المكاني لبيانات الحادث ، ففكر في تجميع بيانات الحادث أو استخدام أداة Optimized Hot Spot Analysis.

بيانات الحادث هي نقاط تمثل الأحداث (الجريمة ، حوادث المرور) أو الأشياء (الأشجار ، المتاجر) حيث يكون تركيزك على الوجود أو الغياب بدلاً من بعض السمات المقاسة المرتبطة بكل نقطة.

تستجوب أداة Optimized Hot Spot Analysis بياناتك لتحديد إعدادات المعلمات تلقائيًا التي ستعمل على تحسين نتائج النقاط الفعالة. سيقوم بتجميع بيانات الحادث ، وتحديد مقياس مناسب للتحليل ، وضبط النتائج للاختبارات المتعددة والاعتماد المكاني. تتم كتابة خيارات المعلمات التي تحددها كرسائل ، وقد تساعدك في تحسين خيارات المعلمات عند استخدام هذه الأداة. تتيح لك هذه الأداة التحكم الكامل والمرونة في إعدادات المعلمات الخاصة بك.

هذا هو الافتراضي. سيضمن نطاق المسافة أو مسافة الحد أن كل ميزة لها جار واحد على الأقل. هذا مهم ، ولكن غالبًا لن تكون هذه المسافة الافتراضية هي أنسب مسافة لاستخدامها في تحليلك. تم توضيح الاستراتيجيات الإضافية لاختيار مقياس مناسب (نطاق مسافة) لتحليلك في اختيار قيمة نطاق مسافة ثابتة.

عند إدخال الصفر في نطاق المسافة أو معلمة المسافة العتبة ، تُعتبر جميع الميزات مجاورة لجميع الميزات الأخرى عندما تُترك هذه المعلمة فارغة ، فسيتم تطبيق المسافة الافتراضية.

تصبح الأوزان للمسافات الأقل من 1 غير مستقرة عند عكسها. وبالتالي ، يُعطى ترجيح المعالم المفصولة بأقل من وحدة مسافة واحدة وزنًا قدره 1.

بالنسبة لخيارات المسافة العكسية (المسافة العكسية ، المسافة العكسية التربيعية ، ومنطقة اللامبالاة) ، ستُعطى أي نقطتين متطابقتين وزنًا واحدًا لتجنب القسمة الصفرية. هذا يؤكد أن الميزات ليست مستبعدة من التحليل.

تتوفر خيارات إضافية لمعلمة مفهوم العلاقات المكانية ، بما في ذلك العلاقات بين المكان والزمان ، باستخدام أداة Generate Spatial Weights Matrix. للاستفادة من هذه الخيارات الإضافية ، قم بإنشاء ملف مصفوفة الأوزان المكانية قبل التحليل ، حدد الحصول على أوزان مكانية من الملف لمعلمة تصور العلاقات المكانية ولمعلمة Weights Matrix File ، حدد المسار إلى ملف الأوزان المكانية الذي قمت بإنشائه.

مزيد من المعلومات حول تحليل الكتلة الزمان والمكان متوفرة في وثائق تحليل الزمان والمكان.

يمكن استخدام طبقات الخريطة لتحديد فئة ميزات الإدخال. عند استخدام طبقة مع تحديد ، يتم تضمين المعالم المحددة فقط في التحليل.

  • ملفات مصفوفة الأوزان المكانية بتنسيق ASCII:
    • تستخدم الأوزان كما هي. يتم التعامل مع العلاقات بين المعالم المفقودة على أنها أصفار.
    • الوزن الافتراضي للإمكانات الذاتية هو صفر ، ما لم تحدد قيمة معلمة حقل إمكانية ذاتي أو تقوم بتضمين أوزان محتملة ذاتية بشكل صريح.
    • يتم تكريم العلاقات غير المتماثلة ، مما يسمح للميزة بأن يكون لها ميزة مجاورة ليس لها جار بحد ذاته. هذا يعني أن الميزة المجاورة مضمنة في حسابات المتوسط ​​المحلي للميزة الأصلية ، ولكن الميزة المجاورة غير مضمنة في حسابات المتوسط ​​العام.
    • إذا كانت الأوزان موحدة في الصفوف ، فمن المحتمل أن تكون النتائج غير صحيحة لتحليلات مجموعات التحديد. إذا كنت بحاجة إلى تشغيل تحليلك على مجموعة تحديد ، فقم بتحويل ملف الأوزان المكانية ASCII إلى ملف .swm عن طريق قراءة بيانات ASCII في جدول واستخدام خيار تحويل الجدول باستخدام أداة Generate Spatial Weights Matrix.
    • إذا كانت الأوزان موحدة في الصفوف ، فسيتم إعادة توحيدها لمجموعات التحديد ، وإلا فسيتم استخدام الأوزان كما هي.
    • الوزن الافتراضي للإمكانات الذاتية هو واحد ، إلا إذا قمت بتحديد قيمة معلمة حقل إمكانية ذاتي.

    يعد تشغيل التحليل باستخدام ملف مصفوفة أوزان مكانية بتنسيق ASCII أمرًا مكثفًا للذاكرة. لتحليلات أكثر من 5000 ميزة ، ضع في اعتبارك تحويل ملف مصفوفة الأوزان المكانية بتنسيق ASCII إلى ملف بتنسيق SWM. ضع أولاً أوزان ASCII في جدول منسق (باستخدام Excel ، على سبيل المثال). بعد ذلك ، قم بتشغيل أداة Generate Spatial Weights Matrix باستخدام جدول التحويل للمعلمة المفاهيمية للعلاقات المكانية. سيكون الإخراج عبارة عن ملف مصفوفة أوزان مكانية بتنسيق SWM.

    تتم إضافة فئة ميزات الإخراج من هذه الأداة تلقائيًا إلى جدول المحتويات مع تطبيق التقديم الافتراضي على حقل Gi_Bin. يتم تحديد العرض من hot-to-cold بواسطة ملف طبقة في & ltArcGIS Pro & gt Resources ArcToolBox Templates Layers. يمكنك إعادة تطبيق العرض الافتراضي ، إذا لزم الأمر ، عن طريق إعادة تطبيق رموز الطبقة.

    يتضمن ناتج هذه الأداة مخططًا بيانيًا لقيمة حقل الإدخال ، والذي يمكن الوصول إليه ضمن فئة ميزات الإخراج في جزء المحتويات.

    يوفر موضوع تعليمات نمذجة العلاقات المكانية معلومات إضافية حول معلمات هذه الأداة.

    حذر:

    عند استخدام ملفات الأشكال ، ضع في اعتبارك أنه لا يمكنها تخزين القيم الخالية. الأدوات أو الإجراءات الأخرى التي تنشئ ملفات أشكال من مدخلات غير شكلية قد تخزن أو تفسر القيم الخالية على أنها صفر. في بعض الحالات ، يتم تخزين القيم الخالية كقيم سالبة كبيرة جدًا في ملفات الأشكال. هذا يمكن أن يؤدي إلى نتائج غير متوقعة. راجع اعتبارات المعالجة الجغرافية لإخراج ملف الشكل لمزيد من المعلومات.

    ميراث:

    لا يؤثر توحيد الصف على هذه الأداة: ستكون نتائج تحليل النقاط الفعالة (إحصائية Getis-Ord Gi *) متطابقة مع توحيد الصف أو بدونه. وبالتالي ، يتم تعطيل المعلمة ، فهي تظل كمعامل أداة فقط لدعم التوافق مع الإصدارات السابقة.

    عند استخدام هذه الأداة في نصوص Python النصية ، فإن الكائن الناتج الذي تم إرجاعه من تنفيذ الأداة يحتوي على المخرجات التالية:


    بناء الجملة

    فئة المعالم ، عادةً ما تكون فئة معلم نقطة ، والتي سيتم حساب متوسط ​​مسافة الجوار الأقرب لها.

    يحدد كيفية حساب المسافات من كل معلم إلى المعالم المجاورة.

    • EUCLIDEAN_DISTANCE - المسافة المستقيمة بين نقطتين (عندما يطير الغراب)
    • MANHATTAN_DISTANCE - المسافة بين نقطتين مقاسة على طول المحاور عند الزوايا القائمة (كتلة المدينة) محسوبة بجمع الفرق (المطلق) بين إحداثيات x و y
    • NO_REPORT - لن يتم إنشاء ملخص رسومي. هذا هو الافتراضي.
    • GENERATE_REPORT - سيتم إنشاء ملخص رسومي كملف HTML.

    قيمة رقمية تمثل حجم منطقة الدراسة. القيمة الافتراضية هي مساحة مستطيل التضمين الأدنى الذي سيشمل كل المعالم (أو كل المعالم المحددة). يجب أن تتطابق الوحدات مع تلك الخاصة بنظام تنسيق الإخراج.


    المعلمات

    المعالم النقطية التي سيتم تنفيذ التجميع على أساس الكثافة لها.

    فئة ميزة الإخراج التي ستتلقى نتائج الكتلة.

    يحدد الطريقة التي سيتم استخدامها لتعريف الكتل.

    • المسافة المحددة (DBSCAN) - سيتم استخدام مسافة محددة لفصل الكتل الكثيفة عن الضوضاء الأقل. DBSCAN هي أسرع طرق التجميع ولكنها مناسبة فقط إذا كانت هناك مسافة واضحة جدًا لاستخدامها تعمل بشكل جيد لتحديد جميع المجموعات التي قد تكون موجودة. ينتج عن هذا عناقيد لها كثافة متشابهة.
    • الضبط الذاتي (HDBSCAN) - سيتم استخدام مسافات متفاوتة لفصل مجموعات ذات كثافات متفاوتة عن ضوضاء قليلة. HDBSCAN هي أكثر طرق التجميع اعتمادًا على البيانات وتتطلب أقل إدخال للمستخدم.
    • متعدد المقاييس (البصريات) - سيتم استخدام المسافة بين الجيران ومخطط قابلية الوصول لفصل المجموعات ذات الكثافة المتغيرة عن الضوضاء. توفر OPTICS أكبر قدر من المرونة في ضبط المجموعات التي يتم اكتشافها ، على الرغم من أنها مكثفة من الناحية الحسابية ، خاصة مع مسافة بحث كبيرة.

    الحد الأدنى لعدد النقاط التي سيتم اعتبارها كتلة. سيتم اعتبار أي مجموعة ذات نقاط أقل من العدد المقدم ضوضاء.

    أقصى مسافة سيتم أخذها في الاعتبار.

    بالنسبة لخيار المسافة المحددة (DBSCAN) الخاصة بمعلمة طريقة التجميع ، يجب العثور على الحد الأدنى من الميزات لكل قيمة معلمة الكتلة ضمن هذه المسافة لعضوية الكتلة. سيتم فصل المجموعات الفردية عن طريق هذه المسافة على الأقل. إذا كانت نقطة تقع على مسافة أبعد من هذه المسافة من أقرب نقطة تالية في الكتلة ، فلن يتم تضمينها في الكتلة.

    بالنسبة لخيار Multi-scale (OPTICS) لمعلمة طريقة التجميع ، فإن هذه المعلمة اختيارية وتستخدم كأقصى مسافة بحث عند إنشاء مخطط قابلية الوصول. بالنسبة إلى OPTICS ، تحدد مؤامرة قابلية الوصول ، جنبًا إلى جنب مع قيمة معلمة Cluster Sensitivity ، عضوية الكتلة. إذا لم يتم تحديد مسافة ، ستقوم الأداة بالبحث في جميع المسافات ، مما سيزيد من وقت المعالجة.

    إذا تُركت فارغة ، فستكون المسافة الافتراضية المستخدمة هي أعلى مسافة أساسية موجودة في مجموعة البيانات ، باستثناء تلك المسافات الأساسية في أعلى 1 بالمائة (أقصى مسافات أساسية). إذا تم توفير قيمة معلمة Time Field ، فيجب توفير مسافة بحث ولا تتضمن قيمة افتراضية.

    عدد صحيح بين 0 و 100 يحدد انضغاط الكتل. سيؤدي العدد القريب من 100 إلى عدد أكبر من المجموعات الكثيفة. سيؤدي الرقم القريب من 0 إلى مجموعات أقل وضغطًا أقل. إذا تُركت فارغة ، فستجد الأداة قيمة حساسية باستخدام اختلاف Kullback-Leibler الذي يجد القيمة التي لا يضيف فيها إضافة المزيد من المجموعات معلومات إضافية.

    الحقل الذي يحتوي على الطابع الزمني لكل سجل في مجموعة البيانات. يجب أن يكون هذا الحقل من نوع التاريخ. إذا تم توفير الأداة ، فستجد مجموعات من النقاط القريبة من بعضها البعض في المكان والزمان. يجب توفير قيمة معلمة فاصل وقت البحث لتحديد ما إذا كانت نقطة قريبة في الوقت المناسب من نظام مجموعة ليتم تضمينها في الكتلة.

    الفاصل الزمني الذي سيتم استخدامه لتحديد ما إذا كانت النقاط تشكل كتلة زمكان أم لا. يمتد الفاصل الزمني للبحث قبل وقت كل نقطة وبعده ، لذلك ، على سبيل المثال ، الفاصل الزمني من 3 أيام حول نقطة ما سيتضمن جميع النقاط التي تبدأ قبل 3 أيام وتنتهي بعد 3 أيام من وقت النقطة.

    • بالنسبة لخيار المسافة المحددة (DBSCAN) لمعلمة طريقة التجميع ، يجب العثور على الحد الأدنى من الميزات لكل قيمة معلمة الكتلة ضمن مسافة البحث وفاصل وقت البحث الذي سيتم تضمينه في مجموعة.
    • بالنسبة لخيار متعدد المقاييس (OPTICS) لمعلمة طريقة التجميع ، سيتم استبعاد جميع النقاط خارج الفاصل الزمني للبحث عند حساب المسافات الأساسية ومسافات الجوار ومسافات الوصول.

    لا يتحكم الفاصل الزمني للبحث في المدى الزمني الإجمالي لمجموعات الزمكان الناتجة. يمكن أن يكون النطاق الزمني للنقاط داخل الكتلة أكبر من الفاصل الزمني للبحث طالما أن كل نقطة لها جيران داخل المجموعة ضمن الفاصل الزمني للبحث.

    المعالم النقطية التي سيتم تنفيذ التجميع على أساس الكثافة لها.

    فئة ميزة الإخراج التي ستتلقى نتائج الكتلة.

    يحدد الطريقة التي سيتم استخدامها لتعريف الكتل.

    • DBSCAN - سيتم استخدام مسافة محددة لفصل الكتل الكثيفة عن الضوضاء الأقل. DBSCAN هي أسرع طرق التجميع ولكنها مناسبة فقط إذا كانت هناك مسافة واضحة جدًا لاستخدامها تعمل بشكل جيد لتحديد جميع المجموعات التي قد تكون موجودة. ينتج عن هذا عناقيد لها كثافة متشابهة.
    • HDBSCAN - سيتم استخدام مسافات متفاوتة لفصل المجموعات ذات الكثافة المتفاوتة عن الضوضاء الأقل كثافة. HDBSCAN هي أكثر طرق التجميع اعتمادًا على البيانات وتتطلب أقل إدخال للمستخدم.
    • البصريات - سيتم استخدام المسافة بين الجيران ومخطط الوصول لفصل المجموعات ذات الكثافة المتفاوتة عن الضوضاء. توفر OPTICS أكبر قدر من المرونة في ضبط المجموعات التي يتم اكتشافها ، على الرغم من أنها مكثفة من الناحية الحسابية ، خاصة مع مسافة بحث كبيرة.

    الحد الأدنى لعدد النقاط التي سيتم اعتبارها كتلة. سيتم اعتبار أي مجموعة ذات نقاط أقل من العدد المقدم ضوضاء.

    أقصى مسافة سيتم أخذها في الاعتبار.

    بالنسبة لخيار DBSCAN الخاص بمعلمة الكتلة ، يجب العثور على قيمة المعلمة min_features_cluster ضمن هذه المسافة لعضوية الكتلة. سيتم فصل المجموعات الفردية عن طريق هذه المسافة على الأقل. إذا كانت نقطة تقع على مسافة أبعد من هذه المسافة من أقرب نقطة تالية في الكتلة ، فلن يتم تضمينها في الكتلة.

    بالنسبة لخيار OPTICS لمعلمة الكتلة ، فإن هذه المعلمة اختيارية وتستخدم كأقصى مسافة بحث عند إنشاء مخطط قابلية الوصول. بالنسبة إلى OPTICS ، تحدد مؤامرة قابلية الوصول ، جنبًا إلى جنب مع قيمة معلمة حساسية الكتلة ، عضوية الكتلة. إذا لم يتم تحديد مسافة ، ستقوم الأداة بالبحث في جميع المسافات ، مما سيزيد من وقت المعالجة.

    إذا تُركت فارغة ، فستكون المسافة الافتراضية المستخدمة هي أعلى مسافة أساسية موجودة في مجموعة البيانات ، باستثناء تلك المسافات الأساسية في أعلى 1 في المائة (هي أقصى مسافات أساسية). إذا تم توفير قيمة معلمة time_field ، فيجب توفير مسافة بحث ولا تتضمن قيمة افتراضية.

    عدد صحيح بين 0 و 100 يحدد انضغاط الكتل. سيؤدي العدد القريب من 100 إلى عدد أكبر من المجموعات الكثيفة. سيؤدي الرقم القريب من 0 إلى مجموعات أقل وضغطًا أقل. إذا تُركت فارغة ، فستجد الأداة قيمة حساسية باستخدام اختلاف Kullback-Leibler الذي يعثر على القيمة التي لا تضيف فيها إضافة المزيد من المجموعات معلومات إضافية.

    الحقل الذي يحتوي على الطابع الزمني لكل سجل في مجموعة البيانات. يجب أن يكون هذا الحقل من نوع التاريخ. إذا تم توفير الأداة ، فستجد مجموعات من النقاط القريبة من بعضها البعض في المكان والزمان. يجب توفير قيمة معلمة search_time_interval لتحديد ما إذا كانت نقطة قريبة في الوقت المناسب من الكتلة ليتم تضمينها في الكتلة.

    الفاصل الزمني الذي سيتم استخدامه لتحديد ما إذا كانت النقاط تشكل كتلة زمكان أم لا. يمتد الفاصل الزمني للبحث قبل وبعد وقت كل نقطة ، لذلك ، على سبيل المثال ، الفاصل الزمني من 3 أيام حول نقطة ما سيتضمن جميع النقاط التي تبدأ قبل 3 أيام وتنتهي بعد 3 أيام من وقت النقطة.

    • بالنسبة لخيار DBSCAN الخاص بمعلمة الكتلة ، يجب العثور على قيمة min_features_cluster المحددة ضمن مسافة البحث وفاصل وقت البحث الذي سيتم تضمينه في المجموعة.
    • بالنسبة لخيار OPTICS لمعلمة الكتلة ، سيتم استبعاد جميع النقاط خارج الفاصل الزمني للبحث عند حساب المسافات الأساسية ومسافات الجوار ومسافات الوصول.

    لا يتحكم الفاصل الزمني للبحث في المدى الزمني الإجمالي لمجموعات الزمكان الناتجة. يمكن أن يكون النطاق الزمني للنقاط داخل الكتلة أكبر من الفاصل الزمني للبحث طالما أن كل نقطة لها جيران داخل المجموعة ضمن الفاصل الزمني للبحث.

    عينة التعليمات البرمجية

    يوضح البرنامج النصي التالي لإطار Python كيفية استخدام دالة DensityBasedClustering.

    يوضح البرنامج النصي Python المستقل التالي كيفية استخدام وظيفة DensityBasedClustering.

    يوضح البرنامج النصي Python المستقل التالي كيفية استخدام وظيفة DensityBasedClustering مع مرور الوقت.


    1 إجابة 1

    أفترض أنك تحاول تراكب أنظمة مرجعية مكانية مختلفة دون أن تخبر arcmap عن تلك التي تستخدمها ، لذلك لا يمكن إعادة إسقاطها لتلائم بعضها البعض.

    عندما تقول "خط العرض" و "خط الطول" ، فأنت تعني عادةً نظام إحداثيات جغرافي مثل WGS84. بينما يشير X و Y غالبًا إلى نظام إحداثيات متوقع مثل NAD. لقد حددت NAD لكلتا الطبقتين. أعتقد أنه يجب عليك تحديد نظام إحداثيات جغرافي لملف CSV الخاص بك ، إذا كان يحتوي بالفعل على إحداثيات جغرافية.

    يستخدم ArcMap نظام الإسناد المكاني للطبقة الأولى التي تمت إضافتها كشاشة عرض SRS (يمكنك تغيير هذا بعد ذلك بالتأكيد) ، ولهذا السبب رأيت ملف الشكل أولاً وبعد إعادة التشغيل وإضافة النقاط التي شهدت النقاط أولاً.

    إذا تم تعريف SRS لكل طبقة بشكل صحيح ، فسيقوم ArcMap بإعادة إسقاطها تلقائيًا لتلائم عرض SRS الخاص بك. إذا قمت بتعريف SRS الخاطئ لطبقة واحدة ، فلن يفعل Arcmap شيئًا مؤكدًا ، لأنه لا توجد حاجة لإعادة طرح طبقة NAD إلى NAD (على الرغم من أن الإحداثيات لها مجال قيمة مختلف تمامًا ويتم رسم نقاطك في مكان آخر. تحقق من ذلك عن طريق النقر بزر الماوس الأيمن على طبقة CSV و "تكبير الطبقة (تمديد)".

    لجعل الأمر أكثر تعقيدًا: نظرًا لأن NAD83 و WGS84 يعتمدان على معطيات جيوديسية مختلفة ، يجب عليك التحويل. يمكنك العثور على مجموعة محددة مسبقًا من معلمات التحويل عند النقر بزر الماوس الأيمن فوق "الطبقات" في "جدول المحتويات" على اليسار وتحديد "الخصائص". في صفحة "نظام الإحداثيات" ، ترى زر "التحويل" حيث يمكنك تحديد معلمات التحويل التي يجب استخدامها للانتقال من NAD83 إلى WGS84 والعكس صحيح. يمكن العثور على وصف أكثر تفصيلاً في GIS SE


    الخوارزمية

    تم وصف الخوارزمية التي أعرضها هنا منذ أكثر من عقد من قبل Adriano Moreira و Maribel Yasmina Santos من جامعة مينهو بالبرتغال [3]. من الملخص:

    تصف هذه الورقة خوارزمية لحساب مغلف مجموعة من النقاط في مستو ، والتي تولد محدبًا على أجسام غير محدبة تمثل المنطقة التي تشغلها النقاط المحددة. تعتمد الخوارزمية المقترحة على نهج k-الأقرب للجيران ، حيث يتم استخدام قيمة k ، وهي معلمة الخوارزمية الوحيدة ، للتحكم في "سلاسة" الحل النهائي. [...]

    لأنني سأقوم بتطبيق هذه الخوارزمية على المعلومات الجغرافية ، كان لا بد من إجراء بعض التغييرات ، أي عند حساب الزوايا والمسافات [4]. لكن هذه لا تغير بأي شكل من الأشكال جوهر الخوارزمية ، والتي يمكن وصفها على نطاق واسع من خلال الخطوات التالية:

    1. أوجد النقطة ذات الأدنى ذ (خط العرض) ينسق ويجعله الحالي.
    2. أعثر على كأقرب نقطة إلى النقطة الحالية.
    3. من ك- أقرب نقطة ، حدد النقطة التي تتوافق مع أكبر انعطاف يمين من الزاوية السابقة. هنا سوف نستخدم مفهوم المحمل ونبدأ بزاوية 270 درجة (الغرب المستحق).
    4. تحقق مما إذا كانت بإضافة النقطة الجديدة إلى سلسلة الخط المتنامية ، فإنها لا تتقاطع مع نفسها. إذا كان الأمر كذلك ، فحدد نقطة أخرى من ملف ك-أقرب أو إعادة تشغيل بقيمة أكبر من ك.
    5. اجعل النقطة الجديدة هي النقطة الحالية وقم بإزالتها من القائمة.
    6. بعد ك التكرارات تضيف النقطة الأولى مرة أخرى إلى القائمة.
    7. حلقة إلى الرقم 2.

    يبدو أن الخوارزمية بسيطة للغاية ، لكن هناك عددًا من التفاصيل التي يجب مراعاتها ، خاصةً لأننا نتعامل مع الإحداثيات الجغرافية. يتم قياس المسافات والزوايا بطريقة مختلفة.


    عشوائية كاملة (حبة البن) المكانية

    أنت تعرف هذا الشعور عندما تجيب على سؤال "ما الذي تدرسه" وتتلقى نظرة فارغة؟ غالبًا ما يُنظر إلى نظم المعلومات الجغرافية على أنها تخصص متخصص ولكني وجدت أنها قابلة للتطبيق على المزيد من المواقف كلما تقدمت في برنامجي. في الوقت الحالي ، أنا جزء من اقتصاد الوظائف المؤقتة ، حيث أقوم بصب القهوة في مقهى صغير مملوك لعائلة في جنوب فيلادلفيا. في صباح أحد الأيام ، سألني زميلي في العمل بريندان عما كنت أخطط للقيام به في النصف الثاني من يومي (الفترة الصباحية تبدأ من 6:30 إلى 1:30). في ذلك الوقت كنت في الأسبوع الرابع من الأسبوع السادس من سرعة البرق الإحصائيات المتقدمة للتحليل المكاني. إذا لم تكن قد التحقت بهذه الدورة التدريبية حتى الآن ، فإنها زوبعة من الرياضيات والترميز ستهيمن على النطاق الترددي لأدمغتك. في الأسبوع الرابع ، الموضوع الذي تتم تغطيته هو الانحدار الموزون جغرافيًا ، أو GWR ، وهو شكل من أشكال الانحدار الخطي مع الكثير من الحسابات المطلوبة لحل المعادلة يدويًا ، فمن المحتمل أن تستغرق ستة أسابيع من الفصل الدراسي فقط F. لذلك ، يتم تنفيذ معظم الجبر بلغة البرمجة R ، ويترك لك فهم مبادئ GWR من خلال مراجعة كل قطعة من الأدبيات التي يمكنك الحصول عليها.

    المفهوم الأساسي في فهم الانحدار الموزون جغرافيًا هو مفهوم العشوائية المكانية الكاملة أو CSR. يمكن معادلة المسؤولية الاجتماعية للشركات بالفرضية الصفرية كما هي مفهومة في الانحدار. يفترض أنه لا يوجد نمط في البيانات ، وبالتالي فإن التنبؤ بالقيم في الوسط هو طريقة أكثر دقة لبناء نموذج لوصف قيم السمات. بدا بريندان مهتمًا بإجابتي على سؤال "ماذا تدرس" عندما وصفت نظم المعلومات الجغرافية كنوع من دمج رسم الخرائط وعلم البيانات والتحليل المكاني ، وتابعت بسؤال يتعلق بنوع الموضوعات في الفصل كان يدرس. قد يكون وصف مفاهيم GWR و CSR للمبتدئين أمرًا ساحقًا أو مملاً ببساطة إذا لم يكن قابلاً للتطبيق إلى حد ما على كيفية رؤيتك للعالم. هذه مهارة لا يزال يتعين علي تطويرها وأتطلع إلى القيام بها ، وفي ذلك الوقت اعتقدت أنني سأجربها.

    حياة باريستا هي حياة فوضوية. خلف المنضدة ، نضع المناشف في كل زاوية وركن حتى نكون مستعدين لتسرب القهوة الذي لا مفر منه ، وانسكاب الحبوب ، والفشل في المعدات المستخدمة لتقديم مشروبك المفضل. أخذ منشفة ووضعها بدقة على المنضدة ، جميع الحواف بالارض ، قمت بإنشاء طائرة لتكون بمثابة مثال لاختبار المسؤولية الاجتماعية للشركات. أمسكت بحفنة من حبوب البن وألقيتها على المنشفة ، مما خلق عقدًا لطيفًا من نقاط البيانات البنية على سطح أبيض. ماذا نلاحظ من خلال فحص توزيع حبوب البن على المنشفة؟ If the fact that some beans tend to cluster towards the middle would this be sufficient enough data to say for certain that some attribute embedded within the beans causes them to cluster? Does location of data points play a role in its’ distribution? What’s with these coffee beans?

    In order to do this we would need to test the theory by running the test many times- as is done in a Monte Carlo simulation which makes a distribution of the results of your regression output as many times as the user pleases. Brendan and I just did the test the one time but if we were to waste a morning seeing whether or not the beans clustered or dispersed we would indeed be able to say with a high degree of confidence how our observations related in space.