أكثر

كيف يمكنني إنشاء خريطة احتمالية صالحة لتوزيعات الأنواع بناءً على بيانات التواجد / الغياب من المربعات المتعددة؟


أنا جديد إلى حد ما على نظم المعلومات الجغرافية وبدأت فقط في تعلم الإحصاء / التحليل المكاني. أنا طالب خريج في علم البيئة أقوم بدراسة قبل وبعد دراسة النباتات الغازية واستجاباتها لجهود الإدارة. أولاً ، إليك بعض الخرائط لتوضيح تصميمي وتجنب الالتباس.

يتكون تصميمي التجريبي من حوالي 100 مقطع مقطعي متناثرة في جميع أنحاء الحديقة. يحتوي كل من هذه المقاطعات في أي مكان من 1 إلى 10 كوادرات موزعة على مسافة 5 أمتار على طولها ، ولكل مربع مساحة 1 م ^ 2. داخل كل مربع ، تم توثيق وجود / عدم وجود 11 نوعًا غازيًا مختلفًا ، أولاً كبيانات أساسية في عام 2007 ، ومرة ​​أخرى في عام 2014 لتحديد ما إذا كانت جهود الإدارة في المتنزه تتحكم في انتشارها. ومع ذلك ، فإن بعض مناطق المتنزه بها مقاطع عرضية موضوعة بالقرب من بعضها البعض (25 مترًا على حدة) بينما توجد مناطق أخرى على مسافة 50 مترًا ، ويساورني القلق بشأن كيفية التعامل مع الاحتمال الزائد والتحيز المكاني في هذه المقاطعات القريبة . لم يكن لدي أي سيطرة على التصميم الأصلي وجمع البيانات الأساسية ، وهذا التصميم بالنسبة لي مجرد قبيح.

بناءً على بيانات التواجد / الغياب التي جمعتها ، أود معرفة توزيع كل نوع لكل عام (22 خريطة) ، وأن أكون قادرًا على تحديد ما إذا كانت هناك أي نقاط ساخنة ذات دلالة إحصائية لأنواع غازية معينة ، أو ما إذا كانت هناك أنواع معينة مرتبطة ببعضها البعض. كان لدي ArcGIS لحساب النقطه الوسطى لكل مربع بحيث يكون لدي كل من ميزات المضلع والنقطة لتمثيل المربع ، إذا لزم الأمر. حتى الآن ، قمت بإنشاء العديد من خرائط كثافة Kernel باستخدام النقطه الوسطى كبيانات نقطية وعمود يحتوي على بيانات ثنائية (التواجد = 1 ، الغياب = 0) كحقل سكاني ، وترك نصف قطر البحث فارغًا ، لأنني غير متأكد من ماذا لتفعله بشأن المسافة المتغيرة بين المقاطع. أنا على يقين من أن Kernel Density ليست ما يجب أن أستخدمه لإنشاء هذه الخريطة بناءً على ما قرأته حتى الآن هنا.

فيما يلي مثال لكثافة Kernel واحدة لـ Euonymus fortuneii في 2007:

من الناحية النوعية ، يبدو أن هذه الخرائط تتطابق مع ما لاحظته بشكل عرضي في الحقل ، لكنني بحاجة إلى ملفات إخراج نقطية لا تنتهك أي افتراضات رئيسية وتلتزم بمنهجية النمذجة المناسبة. أحتاج إلى ناتج نقطي يمكنني إجراء إحصائيات كمية عليه والحصول على معلومات حول الأهمية. مما قرأته ، يبدو أنه استيفاء لأن نوعًا ما من kriging هو ما أحتاج إلى القيام به ، لكنني لست على دراية بهذه التقنيات. ومع ذلك ، لدي ترخيص لتشغيل جميع الملحقات الضرورية في ArcGIS ويمكن (آمل) التعرف عليها إذا لزم الأمر.

أود أيضًا إنشاء خرائط للكشف عن التغيير لكل نوع ، مع إظهار المناطق التي انخفض وجودها فيها والمناطق التي زاد فيها ، وما إذا كانت مهمة أم لا. لقد استخدمت أداة الحاسبة النقطية لطرح البيانات النقطية لكثافة Kernel لعام 2007 من البيانات النقطية لعام 2014 لإنتاج خريطة توضح مناطق الانخفاض باللون الأزرق ومناطق الزيادة باللون الأحمر.

أستطيع أن أقول بناءً على بيانات جدول البيانات وحدها ذلك ألياريا بيتيولاتا زيادة كبيرة في الوجود في عام 2014 ؛ تم العثور عليه في 76/464 كوادرات في 2007 ، و 176/464 كوادرات في 2014. أود أن أكون قادرًا على القيام بذلك في ArcGIS مع الملفات النقطية ، وأنا أعلم أنه يجب أن يكون هناك طريقة.


بينما أتفق معChrisW على أن السؤال غامض للغاية ؛ إليك بعض المؤشرات لتبدأ بها. يبدو أن Kriging هو خيار جيد ، وعلى وجه الخصوص خريطة الاحتمالات. لاحظ أن أي سؤال يسعى إلى معرفة حرفيا: "ما هو ... أو ... كيفية أداء kriging؟" واسع جدًا.

بخصوص خريطة الفرق. لقد بدأت بشكل جيد ويمكنك حساب القيم (1 و 0) لمعرفة عدد الزيادة / النقصان التي حدثت بالنسبة إلى إجمالي الخلايا التي تحتوي على تغييرات (1 + 0 خلية). هذا إذا كان لديك جدول سمات للخطوط النقطية. يمكنك أيضًا إجراء هذا التلاعب على مخرجات kriging.

لاحظ أن استخدام kriging أو أي نوع آخر من الاستيفاء ، يهدف بشكل أساسي إلى التنبؤ بالقيم ، أو الإحصائيات الأخرى (مثل التحقيقات) للخلايا / المواقع التي لم تقم فيها بقياس البيانات. قد يتساءل المرء في دراستك عما إذا كان هذا هو هدفك.

قد تتطلب محاولة اكتشاف انتشار النباتات الغازية تحت تدخل بشري غير مباشر أو تحت إجراءات وقائية أن تقيد استيفاء الإجراءات في مساحة معينة. على سبيل المثال المساحات التي تم صيانتها في ظل بعض البرامج الوقائية ، وهي مساحات لم تكن كذلك. يمكن أيضًا تقييده بالحواجز الطبيعية للنباتات ؛ أي المنحدرات العالية أو المناطق المناخية الدقيقة. قد ترغب أيضًا في التفكير في استخدام البيانات المساعدة لوضع قيود على المسافة من كل مقطع مقطعي يمثله العينة.


فيما يلي عينة من مناهج النمذجة المستخدمة بشكل شائع لتقدير ورسم خرائط لتوزيع الأنواع. يتم تشجيع الممارسين أيضًا على البحث عن خرائط توزيع الأنواع الموجودة واستخدامها. ومع ذلك ، عند استخدام خرائط توزيع الأنواع المتاحة حاليًا ، من المهم للممارسين فهم البيانات والأساليب المستخدمة لإنشاء الخرائط والإبلاغ عنها.

النموذج الخطي المعمم ونموذج الانحدار اللوجستي
ملخص

تستخدم مناهج النموذج الخطي المعمم (GLM) طرق المربعات الصغرى لتناسب العلاقة بين متوسط ​​متغير الاستجابة والجمع الخطي للمتغيرات التفسيرية. عادة ما يتم تمثيل متغيرات الاستجابة لنماذج التوزيع بملاحظات بسيطة لوجود الأنواع أو الوجود أو الغياب أو الوفرة في المواقع الجغرافية بناءً على أخذ العينات الميدانية العشوائية أو الطبقية أو رأي الخبراء أو الملاحظات التي تم الحصول عليها بشكل انتهازي. تمثل المتغيرات التوضيحية في هذا النهج البيانات البيئية التي يُفترض أنها تؤثر بشكل مباشر أو غير مباشر على الأنواع (أوستن 2007). يتم تعريف العلاقة المفترضة بين الاستجابة والمتغيرات التوضيحية بواحدة من عدة وظائف ارتباط تصف التوزيعات الاحتمالية (على سبيل المثال ، التوزيع الطبيعي ، بواسون ، ذو الحدين السالب ، أو توزيع جاما) (Guisan et al.2002).

الانحدار اللوجستي هو نوع خاص من GLM يستخدم لتقييم كيف تتنبأ مجموعة من المتغيرات البيئية بوجود نوع ما. يتم تلخيص بيانات الأنواع في استجابة ذات الحدين (وجود أو غياب) لكل منطقة عينة. يحد نموذج الانحدار اللوجستي من احتمال الوجود والغياب بين صفر و 1 مع وظيفة ارتباط لوجستي ويفترض أن مصطلح الخطأ له توزيع ذي حدين.

متطلبات البيانات

يتطلب كل من GLM ونموذج الانحدار اللوجستي ملاحظات وقياسات ميدانية للعوامل البيئية المتوقع أن تؤثر على توزيع الكائن الحي. يمكن جمع البيانات البيئية باستخدام طرق أخذ العينات الميدانية أو طرق الاستشعار عن بعد.

نقاط القوة

لطالما استخدم GLM (والانحدار اللوجستي) في الأبحاث البيولوجية لمجموعة واسعة من الدراسات لتقدير توزيع الأنواع (Guisan and Thuiller 2005). يتيح النهج مرونة كبيرة في اختيار البيانات البيئية. يسمح هذا النهج للباحثين باختبار العديد من فرضيات العمل باستخدام طرق الاحتمالية القصوى لتحديد النموذج الأكثر شحًا والذي يناسب البيانات المرصودة بشكل أفضل.

نقاط الضعف / الافتراضات

تعتمد نماذج GLM على جودة البيانات وهيكل النماذج المرشحة التي طورها الباحث. يعتمد تحليل الانحدار اللوجستي على افتراض أن نوعًا ما لا يحدث حيث يُعتبر غائبًا (على عكس الوجود ولكن لم يتم اكتشافه). قد يكون هناك عدم يقين بشأن ما إذا كانت المواقع قد تم أخذ عينات منها على نطاق واسع بما يكفي للتحقق من عدم وجود الأفراد.

أيضًا ، يمكن أن تحدث نتائج زائفة إذا كانت المتغيرات البيئية لها تأثير ضئيل أو معدوم على متغير الاستجابة (Burnham and Anderson 2002).

  1. يُفترض أن يكون خطأ كل متغير بيئي موزعًا بشكل مماثل ومستقل
  2. تباين متغير الاستجابة ثابت عبر الملاحظات
  3. يُفترض أن يتبع كل خطأ متغير بيئي وظائف الارتباط المحددة التي تصف توزيع الاحتمالات
  4. وظيفة الانحدار خطية في المتنبئين
السعة المطلوبة (بناء وتشغيل النموذج)

من السهل نسبيًا إنشاء نماذج الانحدار وتشغيلها وتفسيرها بمساعدة العديد من الحزم الإحصائية (على سبيل المثال ، SAS و R).

نماذج الإشغال
ملخص

يقدّر نهج نمذجة الإشغال توزيع أو نسبة المواقع الجغرافية التي يشغلها أحد الأنواع (MacKenzie وآخرون 2002). نظرًا لأن احتمال ملاحظة أحد الأنواع يمكن أن يكون (MacKenzie et al.2002). من خلال زيارات الموقع المتعددة لاكتشاف الأنواع ، يقدر هذا النهج احتمالية اكتشاف نوع ما في الموقع نظرًا لاحتمال وجوده (Mackenzie et al. 2005).

متطلبات البيانات

يتضمن شغل أحد الأنواع داخل الموقع والتوزيع بين المواقع زيارات متعددة للمواقع عندما يكون من الممكن اكتشاف أحد الأنواع (MacKenzie et al.2002). بالنسبة لهذا النهج ، قد تمثل المواقع بقع موائل منفصلة أو وحدات أخذ عينات (على سبيل المثال ، المربعات) التي تتم زيارتها بانتظام كجزء من برنامج مراقبة واسع النطاق. يتم إجراء كل مسح في فترات زمنية منفصلة حيث يسجل المحقق ما إذا كانت الأنواع موجودة أو غائبة في كل مناسبة. تُستخدم مجموعة تواريخ الكشف لكل موقع لتقدير نسبة المواقع التي تشغلها الأنواع. يمكن للمحققين أيضًا جمع الخصائص على مستوى الموقع (على سبيل المثال ، المنطقة والنباتات السائدة) والمتغيرات البيئية التي يُتوقع أن تؤثر على احتمالية اكتشاف الكائنات الحية (مثل الأحوال الجوية ووقت أخذ العينات).

نقاط القوة

يمكن تنفيذ نهج نمذجة الشغل بسهولة أكبر وأقل تكلفة من الطرق المستخدمة لتقدير الوفرة. بالإضافة إلى ذلك ، يمكن تطبيق نمذجة الشغل على برامج مراقبة النطاق المكاني الكبير لتحديد التوزيع المكاني للأنواع في جميع أنحاء المنطقة. يمكن تضمين المتغيرات المشتركة التي يُتوقع أن تؤثر على الاكتشاف أو الشغل بسهولة في نموذج الإشغال لمراعاة عدم التجانس في الكشف الاحتمالي والشغل المتنوع حسب الموقع. يمكن تعديل أحداث أخذ العينات المفقودة من خلال تعديل نموذج الاحتمالية القصوى بشكل طفيف لتقدير احتمالية التواجد.

نقاط الضعف / الافتراضات

واحدة من نقاط الضعف الرئيسية في هذه الطريقة هي الحاجة إلى القيام بزيارات عديدة إلى موقع واحد. بالنسبة لبعض أنظمة الدراسة ، قد يكون الأمر صعبًا من الناحية اللوجستية ويستغرق وقتًا طويلاً. يجب تحديد بقع الموائل من قبل المحقق. ولكن زيادة عدد الزيارات لكل موقع يحسن دقة معدل الإشغال المقدر ، والزيادة الناتجة في المعلومات تحسن دقة التقدير عندما تكون احتمالات الاكتشاف منخفضة (MacKenzie et al.2002). يوفر هذا النهج فقط معلومات عن شغل رقعة ولا توجد معلومات حول ديناميكيات التجمعات أو وفرة الأنواع في الرقعة. لذلك ، من الصعب استخدام هذه البيانات للتكهن بجدوى السكان.

  1. يتم إغلاق المواقع للتغيرات في الإشغال أثناء أخذ العينات (أي النظام المغلق). احتلت المواقع بالأنواع محل الاهتمام طوال فترة المسح ، مع عدم وجود مواقع جديدة مشغولة بعد بدء المسح ، ولا توجد مواقع مهجورة قبل توقف المسح
  2. من المفترض أيضًا أن يكون اكتشاف الأنواع في الموقع مستقلاً عن اكتشاف الأنواع في جميع المواقع الأخرى.
  3. لا يتم أبدًا اكتشاف الأنواع بشكل خاطئ في الموقع عند غيابه ، وقد يتم اكتشاف الأنواع أو لا يتم اكتشافها في الموقع عند وجودها.
السعة المطلوبة

أدى تطوير نهج نمذجة الإشغال إلى توثيق تفصيلي يصف إجراءات أخذ العينات والتحليل (Mackenzie et al.2005). بالإضافة إلى ذلك ، يتوفر برنامج PRESENCE يمكن تنزيله مجانًا لتحليل البيانات (الإصدار 3.1)

نماذج الانتروبيا القصوى
ملخص

نهج نمذجة أقصى إنتروبيا (MaxEnt) باستخدام خوارزمية التعلم الآلي للتنبؤ بالتوزيع الجغرافي للأنواع بناءً على مواقع الأحداث المعروفة وطبقات البيانات البيئية (Elith et al. 2006 ، Phillips et al. 2006). يقدّر نهج نمذجة الانتروبيا القصوى توزيع الأنواع من خلال إيجاد أقصى إنتروبيا (أي الأقرب إلى المنتظم) التوزيع ، مقيدًا بالبيانات البيئية المرتبطة بالمواقع المعروفة للأنواع (Phillips et al. 2006).

متطلبات البيانات

تتطلب نمذجة الانتروبيا القصوى نوعين من بيانات الإدخال ، الإحداثيات الجغرافية لوقوع الأنواع والمتغيرات البيئية الصريحة جغرافياً التي من المحتمل أن تؤثر على توزيع الأنواع على النطاق المكاني والزماني ذي الصلة (فيليبس وآخرون ، ٢٠٠٦). تحتاج مواقع الحدوث فقط إلى تمثيل سجلات التواجد فقط (على سبيل المثال ، متحف التاريخ الطبيعي أو المعشبة) ويوصى بما لا يقل عن 50 إلى 100 موقع حدوث للحصول على تنبؤات قريبة من التوزيع الأمثل (Phillips et al. 2006).

نقاط القوة
  1. الوجود فقط البيانات المطلوبة لحدوث الأنواع
  2. يمكن أن تحتوي الشبكات البيئية على معلومات مستمرة وقطعية
  3. توجد خوارزمية حتمية فعالة للحصول على التوزيع الاحتمالي الأمثل ، وتجنب الحاجة إلى تحليلات عدم اليقين
  4. يمكن تجنب ميزات التركيب الزائد عن طريق ضبط معلمة التنظيم
  5. أحد منتجات المخرجات هو خريطة مستمرة تسمح بالتمييز الدقيق بين توزيع الأنواع في جميع أنحاء المنطقة بأكملها
  6. يوفر نظرة ثاقبة على الأهمية النسبية والعلاقة بين كل ميزة بيئية تتنبأ بتوزيع الأنواع
نقاط الضعف / الافتراضات

يجب أن تكون الخرائط (البيانات ذات المرجعية الجغرافية) للمتغيرات البيئية أو المتغيرات المشتركة التي تمثل الظروف البيئية متاحة لكامل المناظر الطبيعية. بالإضافة إلى ذلك ، يجب قياس المتغيرات البيئية ومواقع حدوث الأنواع لفترات زمنية مماثلة (فيليبس وآخرون 2006). قد لا يكون عدد المتغيرات البيئية المستخدمة بالاقتران مع مواقع الحدوث كافياً لوصف توزيع الأنواع. قد تكون مواقع الحدوث متحيزة ، أو مرتبطة تلقائيًا مكانيًا ، أو قد تكون كثافة / طرق أخذ العينات متباينة على نطاق واسع عبر منطقة الدراسة (فيليبس وآخرون ، 2006). على سبيل المثال ، ربما تم جمع عينات من المتاحف بالقرب من الطرق وضمن شريحة صغيرة من السكان. قد تكون هناك أيضًا أخطاء عند تسجيل مواقع التكرار أو ربما تم التعرف على الأنواع بشكل خاطئ أثناء الملاحظات الميدانية.

السعة المطلوبة

هناك حاجة إلى المعرفة الأساسية بنظم المعلومات الجغرافية للتأكد من أن جميع البيانات البيئية لها نفس الشكل (الإسقاط ، والمدى ، والدقة). يتوفر برنامج Maxent القابل للتنزيل مجانًا لتحليل مواقع التكرار والشبكات البيئية.

وظائف احتمالية اختيار الموارد
ملخص

وظيفة احتمالية اختيار الموارد (RSPF) هي وظيفة رياضية تتنبأ باستخدام الأنواع للموارد أو الموائل بالنسبة لتوافر الموارد أو الموائل (Manly et al.2.2002) - ومن ثم مقياس ملاءمة الموائل. يستخدم النهج بيانات مواقع حدوث الأنواع لتقدير الأماكن التي يتجاوز فيها استخدام الموائل التوافر. يمكن أن يتخذ RSPF العديد من الأشكال الرياضية (Manly et al.2002) ولكن الانحدار اللوجستي هو الشكل الأكثر شيوعًا المستخدم لتقدير ملاءمة الموائل.

متطلبات البيانات
  1. إحداثيات ملاحظات الأنواع ، والمعروفة بالمواقع المستخدمة
  2. إحداثيات المواقع التي قد تحدث فيها الأنواع داخل منطقة الدراسة لتحديد الموائل المحتملة ، والمعروفة باسم المواقع المتاحة. يتم تعريف هذه عادةً على أنها مجموعة فرعية عشوائية من النقاط داخل نطاق منزل الفرد
  3. من المتوقع أن تؤثر البيانات البيئية على توزيع الأنواع
نقاط القوة

تتميز RSPF بالمرونة الكافية لتحديد معلمات البيانات البيئية مع مجموعة واسعة من العلاقات الوظيفية (على سبيل المثال ، المصطلحات متعددة الحدود والتفاعلات). يتناسب هذا النهج بسهولة مع إطار الاحتمالية القصوى مع اختيار النموذج لتحديد المتغيرات البيئية التي تؤثر على توزيع الأنواع. يتيح نهج RSPF للباحثين تفسير المتغيرات البيئية المقدرة في النموذج "الأفضل" بسهولة. يمكن إجراء التحليل على مستويات بيئية متعددة (فردية أو مجموعات سكانية أو أنواع).

نقاط الضعف

يمكن أن تكون مخرجات النموذج حساسة لأخذ عينات من المواقع المتاحة فيما يتعلق بالمواقع المستخدمة التي تمت ملاحظتها.

السعة المطلوبة

المعرفة الأساسية لنظم المعلومات الجغرافية. تم تطوير أداة نظم المعلومات الجغرافية لتنفيذ RSPF بواسطة مركز يلوستون للبحوث البيئية.

نماذج متعددة المتغيرات
ملخص

طريقة النمذجة متعددة المتغيرات شائعة الاستخدام لتقدير توزيع الأنواع هي مسافة Mahalanobis (MD). MD هو مقياس بدون أبعاد للاختلاف من خلال تمثيل المسافة التربيعية القياسية بين مجموعة من المتغيرات البيئية وجودة الموائل المثالية (Clark et al. 1993). ثم يتم استخدام عتبة المسافة لتحديد حدود توزيع الأنواع (تسوار وآخرون ، 2007). عند رسم خرائط توزيع الأنواع فيما يتعلق بجودة الموائل ، يمكن استخدام مقياس MD لتصنيف كل خلية في خريطة الموائل بالنسبة للوصف الإحصائي للموائل التي يستخدمها النوع. كل خلية على خريطة موطن MD مرتبطة بالناقل الذي يصف الخصائص متعددة المتغيرات للموائل في الخلايا التي توجد بها الأنواع.

متطلبات البيانات

بيانات حدوث الأنواع. من المتوقع أن تؤثر البيانات البيئية على توزيع الأنواع.

نقاط القوة

يمكن ربط المتغيرات البيئية ولا يجب تلبية افتراض الحالة الطبيعية متعددة المتغيرات لأن MD يخلق متغيرات جديدة وغير مرتبطة (Clark et al. 1993 ، Knick and Dyer 1997). يمكن أن تكون البيانات البيئية مستمرة أو قاطعة.

نقاط الضعف / الافتراضات

يفترض نهج MD أن الأنواع موزعة على النحو الأمثل في الظروف البيئية المتوسطة ، وأن أي انحراف عن الظروف المتوسطة (المثلى) يرتبط بملاءمة أقل (Farber and Kadmon 2003). على غرار العديد من التحليلات متعددة المتغيرات ، قد يكون من الصعب تفسير كيفية ارتباط المتغيرات البيئية ارتباطًا مباشرًا بتوزيع الأنواع.

السعة المطلوبة

يمكن حساب السطح الذي يمثل مسافة Mahalanobis لتوزيع الأنواع باستخدام البرامج الإحصائية (على سبيل المثال ، R أو SAS). يمكن أيضًا إجراء هذا التحليل باستخدام برنامج إحصائي متعدد المتغيرات مثل PCord.

رأي الخبراء
ملخص

عندما تكون البيانات محدودة ، يمكن للمحققين استشارة مجموعات من الخبراء لتحديد توزيعات الأنواع بشكل ذاتي أو تحديد السمات البيئية التي تؤثر على توزيع الأنواع.يمكن دمج رأي الخبراء في نمذجة توزيع الأنواع من خلال توفير مدخلات في إعداد البيانات ، وتحديد السجلات المشبوهة لوقوع الأنواع ، واختيار السمات البيئية ذات الصلة التي تؤثر على توزيع الأنواع ، وتطوير نماذج مختلفة ، أو عن طريق تجميع الغطاء النباتي في فئات ملائمة الموائل (بيرس وآخرون 2001) .

متطلبات البيانات

يتطلب هذا النهج مجموعة محدودة من البيانات الميدانية. ومع ذلك ، فهي عملية تستغرق وقتًا طويلاً لتحديد وإجراء مقابلات مع الخبراء في مختلف النظم البيئية أو الأنواع. يجب أيضًا مراجعة الأدبيات المنشورة (المقالات والتقارير التي راجعها النظراء) لتكملة معلومات رأي الخبراء. إذا تم عرض نماذج رأي الخبراء مكانيًا ، فستكون هناك حاجة إلى جميع الميزات البيئية ذات الصلة في طبقات البيانات المكانية مثل الشبكات أو المتجهات.

نقاط القوة

نظرًا لقلة جمع البيانات الميدانية أو عدم وجودها ، فإن هذه الطريقة غير مكلفة نسبيًا. بالنسبة لعدد قليل من الأنواع والأنظمة البيئية ، يتوفر الخبراء بمعرفة واسعة تستند إلى عقود من الخبرة الميدانية.

نقاط الضعف

هناك معلومات نشر محدودة أو معرفة الخبراء المتاحة للعديد من الأنواع النادرة والمحمية اتحاديًا. عندما يتوفر الخبراء ، قد يكون من الصعب تقييم درجة خبرتهم وقد يكون من الصعب توحيد تقنيات المقابلة. في حين أنه نهج فعال من حيث التكلفة فيما يتعلق بجمع البيانات الميدانية المحدودة ، فإن دمج رأي الخبراء في نمذجة التوزيع يمكن أن يكون عملية بطيئة ومملة وعادة ما يتم إجراؤها على أساس كل نوع على حدة (Seoane et al. 2005). نادرًا ما يتم التحقق من صحة نماذج التوزيع التي تم إنشاؤها من رأي الخبراء باستخدام بيانات مستقلة. لذلك ، يوجد مستوى عالٍ من عدم اليقين في النموذج حتى تؤكد الملاحظات وجود الأنواع فيما يتعلق بالبيئة.

لمعالجة بعض أوجه عدم اليقين مع اختلاف آراء الخبراء ، يمكن أن تخضع نماذج توزيع الأنواع التي تم إنشاؤها برأي الخبراء لتقنية مقارنة زوجية (عملية التسلسل الهرمي التحليلي) التي طورتها Saaty (Saaty TL ، 1980) ، حيث يصنف الخبراء الأهمية النسبية لكل متغير في زوج باستخدام مقياس مستمر. على سبيل المثال ، يختار كل خبير المتغير الذي يعتبر أكثر أهمية في كل من المقارنات الزوجية ويصنف مدى أهمية المتغير المحدد ، مقارنة مع الآخرين ، على مقياس من 1 (بنفس الأهمية) إلى 9 (أكثر أهمية للغاية). يتم تحويل المقارنات الزوجية إلى مصفوفة من الرتب بناءً على نموذج عملية التسلسل الهرمي التحليلي. يمكن حساب هذه الرتب عن طريق حساب متوسط ​​درجات الاستطلاع لجميع المستجيبين لكل مقارنة زوجية لتمثيل الأهمية النسبية لكل متغير مقابل متغير آخر.

السعة المطلوبة

بالإضافة إلى تحديد موقع الخبراء وإجراء مقابلات معهم ، فإن نمذجة توزيع الأنواع مع رأي الخبراء تتطلب عادةً معرفة نظم المعلومات الجغرافية لتجميع خريطة تغطي الميزات البيئية ذات الصلة المتوقع أن تؤثر على توزيع الأنواع.


مقدمة

تتمثل إحدى القضايا الرئيسية في علم البيئة وبيولوجيا الحفظ في تحديد كيفية توزيع الأنواع في الفضاء. نظرًا لأن خطر الانقراض يرتبط بحجم النطاق [1] ، فإن الانخفاض الكبير في نطاق الأنواع غالبًا ما يحدد التغيير في حالة الحفظ (انظر على سبيل المثال معايير IUCN [2] ، [3]) وإجراءات الحماية الأولية [4] ، [5] . وبالمثل ، تركز المناطق المحمية عادة على النقاط الساخنة للتنوع البيولوجي [6] من أجل الحفاظ بكفاءة على أكبر عدد ممكن من الأنواع [7] - [9]. لذلك ، غالبًا ما يحتاج دعاة الحفاظ على البيئة إلى تقييمات دقيقة لنطاقات الأنواع. إلى جانب وصف النطاق البسيط ، يعد تحديد العوامل الرئيسية التي تحد من التوزيعات أمرًا ضروريًا للتنبؤ بكفاءة بفوائد إدارة الحفظ. من أجل التعامل مع هذه الأسئلة ، تم تطوير عدة طرق لنمذجة توزيع الأنواع (SDM) ، والمعروفة أيضًا باسم النمذجة البيئية المتخصصة (ENM) [10] ، منذ الثمانينيات [11].

يتمثل مبدأ SDM في ربط المواقع المعروفة للأنواع بالخصائص البيئية لهذه المواقع من أجل تقدير وظيفة الاستجابة ومساهمة المتغيرات البيئية [12] ، والتنبؤ بالنطاق الجغرافي المحتمل للأنواع [13]. تقدر هذه النماذج المكانة البيئية الأساسية في الفضاء البيئي (بمعنى آخر. استجابة الأنواع للعوامل البيئية اللاأحيائية [14]) وإسقاطها على الفضاء الجغرافي لاشتقاق احتمالية التواجد لأي منطقة معينة أو ، اعتمادًا على الطريقة ، احتمال أن تكون الظروف البيئية المحددة مناسبة للأنواع المستهدفة [15]. يستخدم ممارسو الحفظ نماذج التوزيع لتقدير أنسب المناطق للأنواع واستنتاج احتمالية التواجد في المناطق التي لا تتوفر فيها مسوحات منهجية [16]. يمكنهم أيضًا تقييم التوسع المحتمل للأنواع المدخلة في المناطق المستعمرة حديثًا [17] ، [18] ، أو تقدير النطاق المستقبلي للأنواع الخاضعة لتغير المناخ [18] ، [19] أو المساعدة في تخطيط المحميات [20].

توجد عدة نماذج إحصائية للتنبؤ بتوزيع الأنواع [21]. ما وراء طرق الانحدار الكلاسيكية (وظيفة اختيار الموارد RSF [22] ، [23] ، النماذج الخطية المعممة GLM [24]) ، النمذجة الحسابية القائمة على التعلم الآلي (على سبيل المثال ، الشبكات العصبية الاصطناعية [25] ، الحد الأقصى للإنتروبيا MAXENT [26] ، التصنيف وأصبحت أشجار الانحدار CART [27]) ذات شعبية متزايدة في السنوات الأخيرة. من بين هؤلاء ، تم وصف MAXENT بأنه فعال بشكل خاص للتعامل مع التفاعلات المعقدة بين متغيرات الاستجابة والتنبؤ [15] ، [28] ، ولأنه قليل الحساسية لأحجام العينات الصغيرة [29]. هذا ، بالإضافة إلى بساطته الشديدة في الاستخدام ، جعل من MAXENT خوارزمية SDM الأكثر استخدامًا. في ديسمبر 2013 ، تم الإبلاغ عن 1886 استشهاداً للمقال الذي يصف الطريقة [30] في Web of Science.

يتم الآن تنفيذ نمذجة MAXENT و SDM بشكل عام في الدراسات الموجهة نحو الحفظ [31]. يتم تسهيل الدراسات الإقليمية أو على مستوى القارة من خلال التوافر الأخير لمجموعات البيانات العالمية. الطبقات البيئية ، مثل متغيرات المناخ العالمي التي تم تطويرها في مشروع WorldClim [32] ، تقدم وصفًا مستمرًا لمناطق كبيرة جدًا [33]. وبالمثل ، فإن تطوير قواعد بيانات التنوع البيولوجي المفتوحة (انظر على سبيل المثال المرفق العالمي لمعلومات التنوع البيولوجي ، GBIF ، http://www.gbif.org) يزيد من التغطية المكانية لملاحظات العمل الميداني التي كان يمكن جمعها بواسطة مشروع واحد. عادةً ما توفر قواعد البيانات هذه بيانات الحضور فقط التي يمكن معالجتها من خلال طرق النمذجة مثل MAXENT.

ومع ذلك ، فإن مجموعات البيانات المستمدة من الملاحظات الانتهازية أو سجلات المتاحف بدلاً من المسوح المخطط لها غالبًا ما تُظهر تحيزًا جغرافيًا قويًا [34] ، حيث تتم زيارة بعض المناطق أكثر من غيرها بسبب سهولة الوصول إليها [35] أو مصلحتها الطبيعية. غالبًا ما يشار إلى تغطية المسح غير المتكافئة لتوزيع الأنواع على أنها تحيز أخذ العينات أو تحيز اختيار العينة أو تحيز المسح. يمكن أن تتأثر جودة النموذج بشدة إذا كانت أجزاء كاملة من المساحة البيئية المناسبة لأحد الأنواع غائبة أو ممثلة بشكل ضعيف في مجموعة بيانات المسح [36] ، [37] ، أو بدلاً من ذلك ، إذا كانت بعض المناطق ممثلة تمثيلا زائدا بسبب العينات المحلية المرتفعة جهود. تساءلت العديد من الدراسات عن تأثير تصميم أخذ العينات [38] ، أو الطبيعة المتحيزة لمجموعات بيانات المتحف والمعشبة [39] على الأداء التنبئي لـ SDMs. والمثير للدهشة أن مسألة القياس الكمي وتصحيح التحيز في أخذ العينات لم يتم تناولها بشكل جيد على الرغم من أهميتها الحاسمة. على الرغم من أن المؤلفين أشاروا إلى أن توزيع المواقع في الفضاء الجغرافي و / أو البيئي قد يؤثر على موثوقية النموذج [35] ، [36] ، [40] - [43] ، التأثير المحتمل لتحيز أخذ العينات في مجموعة البيانات عادة ما يؤخذ في الاعتبار بشكل سيء أو لا يؤخذ في الاعتبار على الإطلاق. ومع ذلك ، يمكن إنشاء مخرجات SDM مختلفة جدًا تؤدي إلى استنتاجات متناقضة سواء تم تصحيح تحيز أخذ العينات أم لا [44] ، مما يجعل دراسات SDM التي لم تتضمن هذه المسألة مشكوكًا فيها بشدة.

فيما يتعلق بالتأثير الكبير لتحيز أخذ العينات على القدرة على التنبؤ SDM ، Araújo et al. [45] اعتبر تحسين تصميمات العينات أحد التحديات الرئيسية الخمسة للتطوير المستقبلي لأهداف التنمية المستدامة. تم اقتراح العديد من طرق تصحيح التحيز [46] - [51] ولكن نادرًا ما يتم استخدامها حتى الآن. لم يتم إجراء مقارنة وتقييم الطرق المختلفة لتصحيح تحيز أخذ العينات إلا مؤخرًا ولم يظهر أي دليل توافقي لحلها. استكشفت بعض الدراسات الحديثة العواقب والحلول المحتملة لتصحيح انحياز أخذ العينات (بواسطة Syfert وآخرون [41] و Kramer-Schadt [52] و Varela et al. [53] و Boria et al. [54]). على الرغم من اهتمامهم ، قام المؤلفون بالتحقيق في دراسة حالة واحدة بحيث لا يمكن تقييم كفاءة طريقة التصحيح عبر الأنواع. ثانيًا ، لم يتم اختبار التحيز التجريبي الناجم عن كثافة أخذ العينات [41] مطلقًا ولم يتم تقييم أكثر من طريقتين للتصحيح في نفس الوقت بينما تم اقتراح أو استخدام العديد من الأدبيات [47] ، [49] ، [55 ]. لذلك ، لم يتم التحقيق في تأثير طبيعة وشدة التحيز على قدرة التقنيات المختلفة لتصحيح تحيز أخذ العينات. ومع ذلك ، تظل هذه مشكلة حرجة ، خاصة بالنسبة للمستخدمين الذين يحتاجون إلى تنبؤات قوية وموثوقة لبرنامج SDM مثل ممارسي الحفظ.

الهدف من هذه الدراسة المقارنة هو اختبار تأثير نوع التحيز وشدة التحيز وطريقة التصحيح على أداء نموذج MAXENT. على عكس الدراسات السابقة المذكورة [41] ، [52] - [54] قمنا بتقييم أداء خمس طرق لتصحيح التحيز من بين الأكثر استخدامًا في ظل ظروف مختلفة من نوع وشدة التحيز. استخدمنا نوعًا افتراضيًا لإنشاء أربعة أنواع من تحيزات أخذ العينات وثلاثة شدة تحيز ، وطبقنا على مجموعات البيانات المتحيزة تصحيحات مختلفة. قمنا بتحديد أداء التصحيح النسبي عبر مجموعة من ظروف التحيز وعبر الأنواع. تم تطبيق نفس الإطار أيضًا على مجموعتي بيانات حقيقيتين. يوضح الشكل 1. سير العمل الكامل الذي استندت إليه التحليلات. لذلك ، توفر الدراسة الحالية لأول مرة تقييمًا شاملاً متعدد الأنواع للطرق الأكثر شيوعًا لتصحيح التحيز في أخذ العينات في ظل سيناريوهات مختلفة للتحيز وشدة التحيز. مخصص لحماية البيئة الذين يستخدمون MAXENT على أساس منتظم ، نتوقع أن يوفر هذا العمل رؤى حول اختيار أكثر الطرق ملاءمة لإنتاج نماذج توزيع موثوقة باستخدام مجموعات البيانات المتحيزة. علاوة على ذلك ، يشجع المصممين على تطوير تحسينات في التقنيات لتصحيح تحيز أخذ العينات المناسب لمجموعة واسعة من طرق النمذجة المتاحة.

تم تغيير مجموعات البيانات الأصلية لنوع افتراضي ونوعين حقيقيين لإنشاء 12 تحيزًا يجمع بين 4 أنواع تحيز و 3 شدة تحيز. تم استخدام خمس طرق لتصحيح انحياز أخذ العينات لتقييم التحسن في التوزيع النموذجي بالنسبة للتوزيع الأصلي باستخدام MAXENT. تم تقييم أداء التصحيح باستخدام AUC و 3 مقاييس للتداخل بين النموذج الأصلي غير المتحيز المصحح.


نماذج توزيع الأنواع المتكاملة: الجمع بين بيانات خلفية التواجد وبيانات شغل الموقع مع الكشف غير الكامل

فيرا كوشكينا *

، يان وانغ

، أسلين جوردون

روبرت إم دورازيو

مات وايت

وليوي

حجر

1العلوم الرياضية ، كلية العلوم ، جامعة RMIT ، ملبورن ، فيكتوريا ، أستراليا2مدرسة العالمية والحضرية والاجتماعية

دراسات ، جامعة RMIT ، ملبورن ، فيكتوريا ، أستراليا 3 USGS Wetland and Aquatic Research Centre ، Gainesville ، FL ، USA

4معهد آرثر ريلا لأبحاث البيئة ، قسم البيئة والأراضي والمياه والتخطيط ، آرثر ريلا

معهد البحوث البيئية ، ملبورن ، فيكتوريا ، أستراليا ووحدة الرياضيات الحيوية 5 ، قسم علم الحيوان ، كلية علوم الحياة ، جامعة تل أبيب ، تل أبيب ، إسرائيل

1. مصدران رئيسيان لبيانات نماذج توزيع الأنواع (SDMs) هما بيانات إشغال الموقع (SO) من المسوحات المخطط لها ، وبيانات خلفية الحضور (PB) من المسوحات الانتهازية والمصادر الأخرى. تعطي استطلاعات SO بيانات عالية الجودة حول وجود وغياب الأنواع في منطقة معينة. ومع ذلك ، نظرًا لارتفاع تكلفتها ، فإنها غالبًا ما تغطي مساحة أصغر بالنسبة لبيانات PB ، وعادةً لا تمثل النطاق الجغرافي للمدن. وعلى النقيض من ذلك ، فإن بيانات PB وفيرة ، وتغطي مساحة أكبر ، ولكنها أقل موثوقية بسبب نقص المعلومات عن غياب الأنواع ، وعادة ما تتميز بأخذ عينات متحيزة. نقدم هنا طريقة جديدة لنمذجة توزيع spespe-cies التي تدمج هذين النوعين من البيانات.

2. لقد استخدمنا عملية نقطة Poisson غير المتجانسة كأساس لبناء SDM متكامل يحتوي على بيانات PB و SO في وقت واحد. إنه أول تنفيذ لنموذج SO-PB متكامل يستخدم بيانات إشغال المسح المتكرر ويتضمن أيضًا احتمالية الكشف.

3. تم تقييم أداء النموذج المتكامل باستخدام البيانات المحاكاة ومقارنتها بالنُهج التي تستخدم بيانات PB أو SO وحدها. وجد أنه متفوق ، حيث يحسن التنبؤات بالتوزيعات المكانية للأنواع ، حتى عندما تكون بيانات SO متفرقة ويتم جمعها في منطقة محدودة. تم العثور على النموذج المتكامل أيضًا فعالاً عندما كانت المتغيرات المشتركة البيئية مرتبطة ارتباطًا وثيقًا. تم توضيح طريقتنا باستخدام بيانات SO و PB الحقيقية للطائرة الشراعية ذات البطون الصفراء (Petaurus australis) في جنوب شرق أستراليا ، مع الأداء التنبئي للنموذج المتكامل مرة أخرى.

4. من المعروف أن نماذج PB تنتج تقديرات متحيزة لشغل الأنواع أو وفرتها. غالبًا ما يؤدي حجم العينة الصغير لمجموعات بيانات SO إلى تنبؤات ضعيفة خارج العينة. تجمع النماذج المتكاملة البيانات من هذين المصدرين ، مما يوفر تنبؤات فائقة لوفرة الأنواع مقارنة باستخدام أي مصدر بيانات بمفرده. على عكس SDMs التقليدية التي لها اعتماد مقيد على المقياس في تنبؤاتها ، يعتمد نموذجنا المتكامل على نموذج عملية النقطة وليس له مثل هذا الاعتماد على المقياس. يمكن استخدامه للتنبؤ بالوفرة على أي مقياس مكاني مع الحفاظ على العلاقة الأساسية بين الوفرة والمساحة.

الكلمات الأساسية: الكشف غير الكامل ، نموذج الإشغال ، خلفية الوجود ، تحيز أخذ العينات ، احتلال الموقع ، عملية النقطة المكانية ، نماذج توزيع الأنواع

أصبحت نماذج توزيع الأنواع (SDMs) أداة بحث متزايدة الأهمية في العلوم البيئية والبيئية. تُستخدم هذه النماذج للتنبؤ بالتوزيع المكاني لوجود الأنواع أو وفرتها بناءً على مواقع الأفراد الذين تمت ملاحظتهم. نماذج الانحدار فاي tted ل

القياسات الخاصة بالموقع للمتغيرات البيئية مثل درجة الحرارة أو هطول الأمطار أو الارتفاع هي الأساس لعمل تنبؤات في موقع معين. يمكن حساب هذه التنبؤات بسهولة للسيناريوهات البيئية المختلفة عن طريق تعديل المدخلات البيئية لـ SDM بطريقة تعكس سيناريوهات تغير المناخ الافتراضية والتغيرات في خصائص المناظر الطبيعية. في بعض السياقات، يمكن استخدام SDMS للتغيرات دراسة عبر الزمن (Elith & أمبير Leathwick 2009 وفلوريدا إرنست و يونغ اند Hooten 2016). تمنحهم القدرة التنبؤية لهذه النماذج مجموعة واسعة من تطبيقات الحفظ ، بما في ذلك إدارة الأنواع المهددة ، وتخطيط الحفظ ،

* كاتب المراسلات. البريد الإلكتروني: [email protected] [ملاحظة تصحيح: تم تعديل عنوان المقالة في 25 أبريل 2017]

بالإضافة إلى توقع النطاقات المحتملة للأنواع الغازية (Elith & amp Leathwick 2009 Guillera-Arroita et al. 2015). هدفنا في هذه الورقة هو تطوير واختبار فئة جديدة من SDMs المتكاملة التي تدمج نوعين مختلفين من مجموعات البيانات البيئية (خلفية التواجد وشغل الموقع) ، مع الأخذ في الاعتبار أيضًا الاكتشاف غير الكامل للأفراد ، وهو مصدر شائع للخطأ في البيئة. المسوحات (Guillera-Arroita et al. 2014 Iknayan et al. 2014).

غالبًا ما تكون البيانات الوحيدة المتاحة لنماذج توزيع الأنواع عبارة عن مجموعة من المواقع التي تم فيها ملاحظة أفراد من الأنواع قيد البحث ، ولكن لا توجد عادةً معلومات عن الغياب ، أي المواقع التي تم مسحها ولم يتم فحص الأنواع لوحظ. غالبًا ما يُشار إلى هذا النوع من البيانات ببيانات الحضور فقط ، ولكننا نشير إليها هنا على أنها بيانات "خلفية التواجد" (PB) ، لأن إجراء التنبؤات باستخدام هذا النوع من البيانات يتطلب معلومات بيئية خلفية للمناطق التي يكون فيها التواجد لم يتم ملاحظته. بالنسبة للعديد من مناطق الدراسة ، تتوفر بيانات PB بكثرة من ما يسمى بـ "الاستطلاعات الانتهازية" ويمكن العثور عليها في مجموعات المتاحف والأعشاب ، وسجلات قاعدة البيانات التاريخية (Pearce & amp Boyce 2006) ، وأصبحت الآن متاحة بشكل متزايد عبر المستودعات عبر الإنترنت مثل المرفق العالمي لمعلومات التنوع البيولوجي (http://www.gbif.org). ومع ذلك ، على الرغم من المحاولات العديدة ، لا يمكن التنبؤ بدقة بالانتشار الحقيقي والتوزيع المكاني للأنواع بناءً على بيانات PB فقط (Fithian & amp Hastie 2013 Hastie & amp Fithian 2013).

تم اقتراح العديد من النماذج لتحليل بيانات PB ، لكن ثلاث فئات فقط من النماذج تم صياغتها بشكل محدد على افتراض أن الأنواع يمكن أن تكون موجودة أو غائبة في المواقع في عينة الخلفية: نماذج Maxent (Phillips ، Anderson & amp Schapire 2006) ونماذج الانحدار الثنائي المعزز بحالة الأحرف (Lee، Scott & amp Wild 2006) ونماذج معالجة النقاط Poisson (Warton & amp Shepherd 2010). تعتمد معلمات أول فئتين من النماذج على المقياس (أي تعتمد على الدقة المكانية المستخدمة في التحليل) ومع ذلك ، مع زيادة هذا القرار ، تتقارب معلمات هذه النماذج مع تلك الخاصة بنماذج عملية نقطة بواسون (Dorazio 2012 Fithian & amp Hastie 2013 Renner & amp Warton 2013). وبالتالي ، يمكن القول إن نماذج عمليات النقطة المكانية (التي تتضمن عمليات بواسون) توفر توحيدًا مفاهيميًا لتحليل بيانات PB (Dorazio 2014 Renner et al. 2015).

تتطلب نماذج عملية النقطة المكانية عادةً تعديلًا قبل استخدامها للتنبؤ بالتوزيع المكاني الحقيقي للأنواع. تشتمل هذه التعديلات على معلمات لتحديد التأثيرات المحددة لتحيز اختيار العينة أو الأخطاء في اكتشاف الأنواع (Chakraborty et al. 2011 Fithian & amp Hastie 2013). ومع ذلك ، قد لا تكون معلمات هذه النماذج قابلة للتحديد ما لم تكن تنبئ وفرة الأنواع واكتشافها متميزة ومستقلة خطيًا (Fithian & amp Has-tie 2013). ينطبق هذا القيد على كل من المتغيرات المشتركة المستمرة والخطيرة ، ولسوء الحظ لا يتم الوفاء به دائمًا في الممارسة العملية.

نظرًا لتعقيدات العمل مع بيانات PB ، فإن الحل البديل هو إجراء دراسات استقصائية موثوقة واسعة النطاق ومخططة على منطقة الاهتمام ، والتي تسجل عمليات الكشف وعدم اكتشاف الأنواع في كل موقع. يوفر هذا بيانات عالية الجودة عن إشغال الموقع (SO) تسجل كلا من

وجود الأنواع وعدم وجودها (K ery، Gardner & amp Monnerat 2010) ، والتي تكون أكثر قيمة عند تكرار المسوحات المخطط لها. نشير إلى هذا النوع من البيانات على أنها بيانات SO. لسوء الحظ ، نظرًا لتكاليف استطلاعات SO ، يمكن أن تغطي مساحة صغيرة فقط في كثير من الأحيان غير ممثلة لمدى النطاق الجغرافي للأنواع. بشكل عام ، أجبر نقص بيانات SO كافية الباحثين البيئيين على إيجاد طرق للعمل بشكل حصري تقريبًا مع بيانات PB على الرغم من التحيزات والمشاكل الأخرى التي قد تنتج عن ذلك.

كان التقدم المهم في السنوات الأخيرة هو تطوير مناهج SDM التي كانت بيانات كل من PB و SO في وقت واحد ، مما يحتمل أن يوفر أداء تنبؤيًا أفضل من SDMs استنادًا إلى بيانات PB أو SO وحدها. اقترحت Dorazio (2014) لأول مرة هذه الطريقة وطبقتها عند العمل مع بيانات PB جنبًا إلى جنب مع البيانات من استطلاعات عدد النقاط. كان نموذج Dorazio (2014) هرميًا وفي المستوى الأول تم تحديد الكثافة (أي الكثافة المتوقعة للأفراد) في أي مكان. في المستوى الثاني ، تم تحديد الكشف عن الأفراد في موقع معين وافترض أنه يعتمد على قدرة المراقب على اكتشاف الأنواع ، والتي قد تختلف باختلاف ظروف المسح. يجب اعتبار الاكتشاف غير الكامل عاملاً هامًا وأساسيًا يجب تضمينه في أي SDM. بشكل مستقل عن Dorazio (2014) ، Fithian et al. (2015) أيضًا نموذجًا لدمج بيانات PB و SO عبر أنواع متعددة في وقت واحد لتقدير وتصحيح تحيز المراقب في بيانات PB بشكل أفضل. أخذ هذا النموذج بعين الاعتبار بيانات المسح الفردي ولم يتضمن تأثيرات الكشف غير الكامل أثناء المسوحات المتكررة.

وقد تم مؤخرا عرض SDMS المتكاملة فقط في الأدب (وفلوريدا إرنست و يونغ اند Hooten 2016)، كان عدد قليل جدا من الدراسات لتقييم منتظم لفائدة والقيود المفروضة على هذه النماذج أنبوبي يخدع. نحن هنا أولًا نصف SDM جديدًا يجمع بين بيانات PB وبيانات SO للمسح المتكرر ، والذي يسمح أيضًا بالكشف عن النقص المكاني غير المتجانس. يستفيد SDM هذا من نموذج معالجة نقطة Poisson المخفف لبيانات PB (Dorazio 2014) ، بينما يتضمن أيضًا نسخة منقحة من نموذج الإشغال التقليدي لبيانات SO للمسح المتكرر (MacKenzie et al.2002). معلمات نماذج الاحتجاب التقليدية لها تعريفات وتفسيرات غير مرغوبة تعتمد على المقياس. في المقابل ، فإن معلمات SDM المقدمة هنا ثابتة في اختيار المقياس المكاني. على حد علمنا ، هذا هو أول تنفيذ لـ SDM المتكامل الذي يمكن استخدامه مع منهجية SO المسح المتكرر.

في HOMOGENEOU S P OISSO N PR OCESS PB MODEL نحن نعتبر منطقة الدراسة B التي تضم مجموعة من مواقع PB s1. . . sn ، التي يشغلها أفراد من نوع معين. من المفترض أن هذه المواقع هي تحقيق لعملية بواسون غير متجانسة (IPP) (Cressie 2015). تتميز العملية بوظيفة شدة غير سالبة k (s) ، والتي تشير إلى الحد من العدد المتوقع للأفراد لكل وحدة مساحة في الموقع s. نظرًا لأن معدل (ق) الشدة يختلف باختلاف الموقع ، فإن العملية غير متجانسة. عدد الأفراد في المنطقة B هو متغير Poisson العشوائي بمتوسط

عدد الأفراد الواردة في أي منطقة فرعية ج⊂B لديه أيضًا ملف توزيع Poisson (l (C)). علاوة على ذلك ، يُفترض أن يكون عدد الأفراد الموجودين في منطقة فرعية واحدة مستقلاً عن عدد الأفراد في أي منطقة فرعية أخرى غير متداخلة.

تُصاغ الكثافة (ق) عادةً كدالة لوغاريتمية خطية ، اعتمادًا على متنبئات الموقع أو المتغيرات المشتركة x (s) في الموقع:

logðkðsÞÞ ¼ b0xðsÞ ¼ b0þX l j¼1

bjxjðsÞ eqn 1 حيث يتم تعريف متجه المعاملات على النحو التالي: b0 ¼ ðb0 b1. . . blÞ ، حيث يشير b 0 إلى مصطلح التقاطع و thebj هو العميل المرتبط بـ jth (j= 1 ،. . . ، ل) متنبئ. المتغير المشترك x1ðsÞ ، لـ امتحان ple ، قد يمثل درجة الحرارة في الموقع s ، في حين أن x2ÞsÞ قد تمثل الارتفاع. يتضمن ملاءمة النموذج تقدير كلٍّ من التقاطع المجهول b0 والمكونات l.

بعد Dorazio (2014) ، نفترض أنه نظرًا لوجود أنواع فردية في المواقع s2 B ، فإن احتمال اكتشافها هو b (s). في صيغتنا ، تتضمن الوظيفة b (s) كلاً من تحيز أخذ العينات والكشف غير الكامل ، وكلاهما متشابه إذا كان كلاهما يعتمد على المتغيرات البيئية المشتركة (Guillera-Arroita et al. 2015). على هذا النحو ، سيشار إلى هذين التحيزين باسم "قابلية الاكتشاف" أو "احتمال الاكتشاف". عند نمذجة احتمالية الاكتشاف ، نفترض وجود دالة لوجستية خطية مع متغيرات مشتركة خاصة بالموقع:

logitðbðsÞÞ ¼ a0wðsÞ ¼ a0þX g j¼1

هنا ، a0 ¼ ða0 a1. . . agÞ هو متجه المعلمات المراد تقديرها.

إن تحديد المتغيرات البيئية المشتركة التي يجب استخدامها لنمذجة احتمالية الكشف في المسوحات الانتهازية ليست مهمة تافهة وقد تعتمد على رأي الخبراء. أوراق حديثة ، مثل Fithian et al. (2015) ، فليتشر وآخرون. (2016) وآخرون ، اقترحوا استخدام مؤشرات التنبؤ مثل المسافة إلى الطريق أو المراكز السكانية كمؤشرات تنبؤية لنمذجة عنصر قابلية الاكتشاف الذي يساهم في عملية الإبلاغ المتحيزة.

بافتراض أن الأنواع تم اكتشافها في مواقع m1. . . سم& lt ن) في الدراسات الاستقصائية الانتهازية ، يمكن نمذجتها على أنها عملية بواسون ضعيفة مع الشدةم (ق) في الموقع على غرار منتج ك (ق) وب (ق) (دورازيو 2014). وبالتالي ، فإن العدد المتوقع لمواقع التواجد المكتشفة في المنطقة "ب" هو:

كما هو موضح في Dorazio (2014) ، فإن دالة الاحتمال لتقدير a وب في نموذج PB كعملية Poisson ضعيفة

LPBðb aÞ ¼ exp Z BkðsÞbðsÞds صm i¼1kðsiÞbðsiÞ ¼ exp Z B expðb0xðsÞ þ a0wðsÞÞ 1þ expða0wðsÞÞ ds Ym i¼1

expðb0xðsiÞ þ a0wðsiÞÞ 1þ expða0wðsiÞÞ:

لاحظ أن هذا الاحتمال LPB يتكون من مكونين ، أحدهما يتعامل مع تكامل يتطلب معلومات المتنبئين على منطقة الخلفية بأكملها B ، ومنتج يتعامل مع مواقع PB المكتشفة.

S IT E - O C C U P A N C Y M O D E L

تم استخدام نموذج SO التقليدي (MacKenzie et al. 2002 Tire et al. 2003) على نطاق واسع لتحليل بيانات SO التي تم جمعها في المسوحات المتكررة لنفس الموقع. تنقسم منطقة الدراسة أو جزء من منطقة الدراسة إلى K مواقع غير متداخلة ، والتي نشير إليها بواسطة C1. . . CK ، ويتم مسح كل موقع في مناسبات أخذ العينات T. لاحظ أن T لا يحتاج إلى أن يكون هو نفسه لجميع المواقع وأن بعض المواقع (ربما كثيرة) قد يكون لها T = 1 (أي لا يوجد نسخ متماثل). بالإضافة إلى ذلك ، لاحظ أنه بينما تتم صياغة نموذج IPP على مساحة مستمرة ، يتم تطبيق نموذج SO التقليدي على مجموعة من المواقع المنفصلة في الفضاء.

تنتج مسوحات SO مصفوفة من الملاحظات الثنائية yij (i = 1،..، K j = 1،..، T) ، مع yij ¼ 1 إذا تم اكتشاف الأنواع في الموقع i أثناء المسح j و yij ¼ 0 غير ذلك. يُعرَّف احتمال اكتشاف pijis على أنه احتمال اكتشاف النوع في الموقع i في المسح j ، بالنظر إلى الموقع i الذي تشغله الأنواع ذات الاحتمالية (i = 1،..، K).

من المعقول أن نتوقع أن احتمال الكشف قد يتأثر بكل من الخصائص المكانية والزمانية مثل الظروف المناخية وكثافة الغطاء النباتي ووعورة التضاريس. يمكن إدخال هذه المتنبئات بسهولة في نموذج الإشغال ، باستخدام وظيفة تسجيل الدخول ، على النحو التالي:

logitðpijÞ ¼ c0vij: eqn 4 يشتمل احتمال الاكتشاف في نموذج PB على كل من انحياز اختيار العينة وخطأ المراقب (أي الفشل في اكتشاف الأنواع عندما تكون موجودة) ، في حين أن احتمال الاكتشاف في نموذج SO يتضمن خطأ المراقب فقط لأن مواقع مسح SO حسب التصميم. علاوة على ذلك ، يرتبط احتمال الكشف في نموذج PB بموقع على مستوى النقطة ، بينما يتوافق احتمال الكشف في نموذج SO مع موقع على مستوى الموقع.

الاحتمالية التي اقترحها MacKenzie et al. (2002) لنمذجة بيانات SO على النحو التالي:

LSOðwi cÞ ¼ Yk i¼1 wiYT j¼1 pyij ijð1 pijÞ1 y ij & # 34 # Y K i¼kþ1 wi YT j¼1ð1 pijÞ þ ð1 wiÞ & # 34 #: eqn 5

يتوافق الجزء الأول من وظيفة الاحتمال مع مواقع k مع اكتشاف واحد على الأقل ، في حين أن الجزء الثاني من الاحتمالية يتم محاكاته لمواقع K k التي لا تحتوي على اكتشافات على الإطلاق. لاحظ ، كيف من أي وقت مضى ، أن هذه الصيغة لنموذج الشغل تعتمد على المقياس ، والتي تؤثر على تعريفات وتفسيرات معلماته (MacKenzie et al.2002).

يجمع SDM المتكامل بين بيانات المسح المخطط لها PB و SO من أجل تحسين دقة ودقة تقديرات المعلمات. يستخدم عملية IPP الفضائية المستمرة لنمذجة بيانات SO ، مما يسمح بنمذجة بيانات PB و SO في نفس الإطار. إن احتمال الشغل في الموقع Ci هو الذي يجعل من الممكن ربط الأساليب في مساحة مستمرة ومحددة. دع NðCiÞ يمثل عدد الأفراد الموجودين (أو الوفرة) في الموقع Ci ، ولاحظ أن NðCiÞ لديها توزيع بواسون يعتمد على دالة الكثافة مثل القيم المنخفضة: NðCiÞ PoissonðlðCiÞÞ ، حيث lðCiÞ ¼ صج

طريقة التفكير في الأمر هي أن اختيار المقياس المكاني المستخدم في مسوحات SO يستحث مجموعة سكانية ذات حجم ثابت في كل موقع مسح. وبالتالي فإن نموذج بيانات SO المستخدمة في SDM المتكامل لدينا هو

مكافئ بدقة لنموذج الإشغال القائم على الوفرة (انظر القسم 4.5.1 من Royle & amp Dorazio 2008).

يوفر هذا التوزيع لـ NðCiÞ الأساس لتحديد احتمال إشغال الموقع Cias كما يلي:

wi¼ PrðNðCiÞ [0Þ ¼ 1 exp Z Ci

حيث يزداد احتمال الحدوث مع مساحة الموقع Ci. وبالتالي يمكن كتابة احتمالية السجل لنموذج الإشغال المستند إلى الوفرة لبيانات SO من حيث b و c كـ

LSOðb cÞ ¼Y k i¼1ð1 e R CikðsÞdsÞY T j¼1 pyij ijð1 pijÞ1 y ij YK i¼kþ1 ð1 e RCikðsÞdsÞY T j¼1 ð1 pijÞ þ e RCikðsÞds! eqn 7 حيث k (s) هي دالة لـ b ، مثل وظيفة السجل الخطي في eqn (1) و pij هي دالة ofc ، على سبيل المثال وظيفة logit-linear في eqn (4). على عكس ماكنزي وآخرون. (2002) ، فإن دالة الاحتمالية هذه مشتقة من نموذج الإشغال القائم على الكثافة ، مما أدى إلى ثبات المعلمات في اختيار المقياس المكاني (انظر Dorazio 2014 ، ص. 1482). مرة واحدة في كثافة المعلماتتم تقدير ب ، يمكن التنبؤ مسبقًا بخرائط الوفرة الفردية أو احتمالية الحدوث باستخدام أي مقياس مكاني. لا يتم مشاركة هذا التنوع من خلال نماذج الإشغال التقليدية.

نظرًا لأن التكاملات في كل من eqns (3) و (6) لا يمكن تقييمها تحليليًا ، فيمكن تقريبها باستخدام التكامل العددي ، أي عن طريق استبدالها بمجموع مرجح من النقاط التربيعية على منطقة inte-gral. نقسم منطقة الدراسة إلى شبكة مستطيلة ، مع تحديد نقطة تربيعية واحدة بشكل عشوائي وموحد من كل خلية شبكية (Baddeley ، Rubak & amp Turner 2015). يتم استخدام حجم الشبكة كوزن تربيعي ثابت في التقريب.

باتباع Dorazio (2014) ، من الممكن مضاعفة وظائف الاحتمال (3) و (7) من نماذج PB و SO ، بناءً على افتراض أن مجموعات البيانات PB و SO مستقلة عن بعضها البعض. قد يكون هذا غالبًا تقديرًا تقريبيًا جيدًا حيث يتم عادةً اختيار مواقع المسح لبيانات SO بشكل مستقل عن بيانات PB الحالية ، وبالإضافة إلى ذلك ، يتم عادةً جمع استطلاعات PB و SO على فترات زمنية مختلفة. وبالتالي يمكن التعبير عن الاحتمالية المشتركة لـ SDM المتكامل كـ L.متكامل ب a cÞ ¼ LPBðb aÞ LSOðb cÞ يسمح eqn 8 وتعظيم هذا الاحتمال بتقدير جميع المعلمات في SDM المتكامل.

أداء SDM المتكامل

في هذا القسم ، نستكشف أداء SDM المتكامل من خلال فحص قدرته على تقدير المعلمات الرئيسية من البيانات المحاكاة التي تُعرف خصائصها. تصميم المحاكاة مشابه لتلك الموصوفة في Dorazio (2014). يفترض أن تكون منطقة الدراسة B مربعة مقسمة إلى 10009 1000 خلية شبكية. تم إنشاء اثنين من المتنبئين البيئيين ، x (s) و w (s) ، باستخدام توزيعات ثنائية المتغير تختلف مكانيًا وكانت مستقلة عن بعضها البعض. تم اختيار التوزيعات ثنائية المتغير بحيث يتم تحديد كل من x (s) و w (s) في كل نقطة على الشبكة ثنائية الأبعاد B. يتم عرض المتغيرات المشتركة x (s) و w (s) في الشكل 1 (أعلى) صف) فوق المنطقة ب (انظر المعلومات الداعمة للحصول على تفاصيل حول كيفية إنشاء المتغيرات المشتركة).

P R E S E N C E - B A C K ​​G R O U N D DA T A

لتوليد بيانات PB ، تمت محاكاة الكثافة (k) باستخدام دالة السجل الخطي التي تعتمد على covari-ate x (s):

logðkðsÞÞ ¼ ب0þ ب1xðsÞ eqn 9 لاحظ أن المعلمات الرئيسية التي سنحاول تقديرها من البيانات المحاكاة هي ب0 ¼ سجل 8000 9 و b1 0 5 ، كما في Dorazio (2014). قطعة من الشدة k (s) ، و

الكثافة المتوقعة للأفراد ، مبينة في الشكل 1 ، ويوضح كيف (ق) يختلف باختلاف x (ق) على منطقة الدراسة ثنائية الأبعاد ب.

تُستخدم وظيفة تسجيل الدخول لنمذجة احتمالية الاكتشاف ، b (s) ، التي تعتمد على المتغير المشترك الفردي w (s) ، عبر

logitðbðsÞÞ ¼ a0þ a1wðsÞ eqn 10

التي تحدد كيف يعتمد احتمال الاكتشاف على المتغير المشترك الثاني w (s). بالنسبة لعمليات المحاكاة لدينا ، فإن قيم المعلمات هي a0 1 و a1 1. الشكل 1

يوضح كيف يتغير احتمال الاكتشاف مكانيًا فوق المنطقة B بسبب التغيرات في w (s). لاحظ أن المنتج k (s) b (s) هو الذي يحدد التوزيع الفعلي لمواقع الأفراد المكتشفة ، أي توزيع بيانات PB المرصودة تم رسم هذا المنتج في الشكل 1. اللوحات السفلية الثلاثة في الشكل. 1 يشير إلى نطاق المشكلة ، أي بالنظر إلى البيانات المرصودة الموزعة وفقًا للمنتج k (s) b (s) ، هل من الممكن إعادة بناء دالة الشدة الحقيقية k (s) واحتمالات الاكتشاف ب (ق) موضح في الشكل 1.

بالنسبة لبيانات PB ، تتم محاكاة التواجد الحقيقي باستخدام وظيفة (وظائف) الشدة k ولكن يتم إضعافها بواسطة احتمال الاكتشاف b (s). بالنسبة لإعداد النموذج الحالي ، تمت محاكاة 11250 حالة تواجد تم اكتشافها في المتوسط ​​للحالة الأساسية. بالإضافة إلى احتمال الاكتشاف b (s) ، يُفترض أن البيانات تخضع لتحيز أخذ عينات إضافي لا يمكن تفسيره بواسطة المتغيرات البيئية المشتركة. لتحقيق ذلك ، اخترنا عشوائيًا 30٪ من العدد الإجمالي للوجود الحقيقي المكتشف كحالات التواجد المرصودة (بمتوسط ​​3378 نقطة لحالة الخط الأساسي). هذا يضمن أننا نعمل مع بيانات PB الحقيقية بدلاً من نوع بيانات الحضور والغياب.

S IT E - O C C U P A N C Y D A T A

عند محاكاة بيانات SO ، تم تقسيم منطقة الدراسة B إلى شبكة من 2509250 موقعًا أو خلية. تم حساب قيم المتغيرات المشتركة عند مستوى الدقة المرتبط ، باستخدام القيم المتوسطة للمتغيرات المشتركة من المناطق المجمعة. تم اختيار مواقع مواقع مسح SO بشكل عشوائي في جميع أنحاء منطقة الدراسة بأكملها. تم إنشاء بيانات SO على مجموعة من مواقع مسح SO (50 ، 100 ، 200 ، 400 أو 800). تمت محاكاة مواقع التواجد الحقيقي للأنواع وفقًا للرموز الموجودة في eqn (9) ، مع اعتبار الموقع مشغولًا إذا كان هناك فرد أو أكثر موجودًا في منطقة الموقع. لقد قمنا بمحاكاة كل موقع تتم زيارته بواسطة T = 4 استطلاعات متكررة ، مع احتمال أن يكون الاكتشاف (p (s)) في أي موقع هو نفسه لجميع الاستطلاعات المتكررة الأربعة ، ويعتمد فقط على المتغير المشترك الفردي w (s) [الشكل . 1 (الصف العلوي ، اللوحة اليمنى)] ، على النحو التالي:

logitðpjðsÞÞ ¼ c0þ c1wðsÞ eqn 11

هنا يمثل j المسح j وتم تعيين معاملات نموذج الاكتشاف toc0 ¼ 0 و ج1 ¼ 1 5 ، ينتج عنه logitðpjðsÞÞ ÞÞ 1 5 wðsÞ. هنا نفترض الكشف

تتأثر القدرات المحتملة ، b (s) في نموذج PB و p (s) في نموذج SO ، بنفس المتغير المشترك (s).

E S T I M A T IN G P A R A M E T ER S

كان هدفنا الأول هو تقييم SDM المتكامل عن طريق اختباره على مجموعات بيانات PB و SO المحاكاة ، والتي تضمنت الكشف غير الكامل ، ومقارنة النتائج بالنماذج القائمة على بيانات PB أو SO وحدها. هذا يتطلب تقدير المعلمات b0andb1 (تحديد k (s) في eqn 9) ، ومقارنة

تقدير القيم الحقيقية المستخدمة لتوليد مجموعات البيانات PB و SO في المقام الأول. أي ، بالنظر إلى مجموعات بيانات PB و SO المحاكاة التي تم إنشاؤها بواسطة معلمات محددة مسبقًا ، ومعرفة المتغيرات المشتركة البيئية ذات الصلة ، فهل نحن قادرون على تقدير0 وب1 بدقة وبالتالي توقع شدة (كثافة) النموذج على منطقة الدراسة بأكملها ب. ثانيًا ، ما مدى تحسن دقة هذه التقديرات والتنبؤات مع زيادة عدد مواقع SO المدرجة في التحليل؟ تم إجراء التحليلات ومقارنتها على النحو التالي: (1) باستخدام بيانات PB فقط وتقدير المعلمات باستخدام Likeli-hood LPB (انظر eqn 3) (2) باستخدام بيانات SO فقط والتقدير

المعلمات مع احتمال LSO (انظر eqn 7) و (3) باستخدام كليهما

نفس مجموعات البيانات PB و SO وتقدير المعلمات مع الاحتمال المشترك LIntegrated (انظر eqn 8). في الكل

تم الإبلاغ عن التجارب الواردة أدناه ، تم إنشاء 500 عملية تحقق من البيانات المحاكاة ، مع النماذج التي تم ربطها بعد ذلك بكل تحقيق للبيانات الوسائل المبلغ عنها وفترات الثقة التي تمثل تباينًا مُرسلًا لمخرجات النموذج عبر جميع عمليات الإدراك البالغ عددها 500. تم اختبار جميع النماذج باستخدام طريقة الاحتمال القصوى ، في R (الإصدار 3.2.4) ، ويتم توفير شفرة مصدر R في معلومات Sup-porting.

تقارن المخططات الصندوقية في الشكل 2 تقديرات الاحتمالية القصوى لمعلمات النموذج ، باستخدام مجموعات البيانات الثلاث. من الشكل 2 أ ، يتضح أن نموذج PB متحيز بشدة ويؤدي إلى تقديرات أقل بشكل ملحوظ لمصطلح التقاطع (ب).0مقارنة بالقيمة الحقيقية. هذا التحيز (الفرق بين المتوسط ​​المقدر وقيمة المعلمة الحقيقية) في التقدير ب0هي واحدة من المشاكل الرئيسية المتأصلة في نماذج PB. من ناحية أخرى ، يوفر كل من نموذج SO (باستخدام 200 موقع) و SDM المتكامل تقديرات معقولة وغير متحيزة تقريبًا لـ b0. توضح مخططات الصندوق كيف أن تضمين مواقع SO في تحليل SDM المتكامل ، يقلل من التحيز المتأصل في نموذج PB. يوضح الشكل 2 ب معلمة المنحدر ب1، ومن الواضح أن النماذج الثلاثة تقدم تقديرات غير متحيزة لـ b1. ومع ذلك ، فإن تحليل SO له فاصل ثقة أكبر بشكل ملحوظ من نموذج PB أو SDM المتكامل.

رسم بياني 1.خريطة التوزيع المكاني للمتغيرات المشتركة x (s) و w (s) (الصف العلوي) وشدة الإشغال k (s) (من eqn 9) ، واحتمال الكشف b (s) (من eqn 10) ، ومنتجها (s) ) ب (ق) (الصف السفلي). يمثل الأخير التوزيع المتوقع للأفراد المرصودين ، بالنظر إلى أن البعض لم يتم اكتشافه بسبب تأثيرات ب (ق). تمثل المربعات المؤطرة في الصف العلوي المنطقة التي تم مسحها في سيناريو "منطقة مسح إشغال الموقع الصغيرة" (انظر النص).

باختصار ، توضح المخططات الصندوقية في الشكل 2 أ ، ب أن التقديرات المجمعة لكليهما ب0وب1تتفوق على SDM Inte-grated عند مقارنتها بنموذج PB أو SO. يبدو أن SDM المتكامل يرث دقة تقديرات الأصحاب في ب0من نموذج SO مع الاحتفاظ بالدقة وفاصل الثقة الصغير لتقديرات ب1من نموذج PB.

يوضح الشكل 3 كيف تؤثر كميات مختلفة من بيانات SO على تقديرات ب0وب1. يتم رسم القيم الحقيقية للمعلمات (الخط الأحمر) ومقارنتها مع تقديرات مجموعات البيانات ذات الصلة. ترتبط الألواح الموجودة في الصف العلوي بـ SDM Inte-grated و PB ، بينما تتعلق الألواح الموجودة في الصف السفلي بنموذج SO وحده. يمثل الخط الأسود الصلب في الشكل 3 ب0، وهو متوسط ​​500 تقدير مختلف لـ b0. لبيانات PB فقط ، b0 7 6 وهو أمر مهم

أصغر من القيمة الحقيقية ب0 ¼ 9 وبالتالي يدل على تحيز كبير (الشكل 3 أ). نظرًا لتضمين المزيد من مواقع SO في التحليل ، ب0 يتعارض مع قيمته الحقيقية. مع تضمين 50-100 موقع SO ، هناك تباين كبير بين تقديرات ب0كما يتضح من فواصل الثقة العريضة البالغة 95٪ لـ b0(منطقة مظللة في الصورة). ومع ذلك ، نظرًا لإضافة أكثر من 400 موقع SO ، ب0تتطابق تقريبًا مع القيمة الحقيقية ، وتكون فترات الثقة صغيرة نسبيًا.

يفحص الشكل 3 ج ، د نموذج SO فقط. يمكن ملاحظة أنه بالنسبة لـ 50 موقعًا من مواقع SO ، فإن تقدير b0 يتفوق على SDM المتكامل في الشكل 3 أ. وذلك لأن SDM المتكامل دائمًا ما يعوقه عدم قدرة PB الخاص به

نموذج فرعي لتقدير التقاطع بشكل صحيح ب0. لا يزال أداء SDM Inte-grated يعمل بشكل أفضل بسبب التقدير الصحيح للعميل.1. علاوة على ذلك ، عندما يزيد عدد مواقع SO إلى ما بعد 100 ، يكون هناك اختلاف بسيط بين SDM المتكامل ونموذج SO النقي في تقدير التزاوج (ب).0. وهذا ينطبق على كل من وسائلها وفترات الثقة. لكن الشيء نفسه لا ينطبق على ب1، حيث ينتج كل من نموذج SDM المتكامل ونموذج PB تقديرات أفضل بكثير من نموذج SO ، كما هو موضح من خلال مقارنة CI في اللوحات اليمنى من الشكل 3 ب مع د.

استكشاف سيناريوهات أخرى

لقد درسنا أداء SDM المتكامل في إطار عدة سيناريوهات إضافية.

S M A L L S O S U R V E Y A R E A

نظرًا للموارد المطلوبة لإجراء مسوحات SO ، يتم إجراؤها غالبًا في منطقة فرعية صغيرة متجاورة من منطقة الدراسة. ومع ذلك ، في تحليلاتنا السابقة ، تم اختيار مواقع دراسة SO عشوائيًا على منطقة الدراسة بأكملها B. هنا ندرس كيف أن جمع بيانات SO من مجموعة فرعية مقيدة من منطقة الدراسة B ، قد يؤثر على أداء SDM المتكامل.

في هذا السيناريو ، تم اختيار مواقع دراسة بيانات SO من منطقة تضم 6 25٪ من إجمالي المناظر الطبيعية B.

الشكل 2. المخططات الصندوقية لتقديرات الاحتمالية القصوى لمعلمات النموذج b0 و b1 التي تم الحصول عليها من خلال بيانات خلفية التواجد (PB) (3400 موقع) ، وبيانات شغل الموقع (SO) (200 موقع) ، والبيانات المجمعة وهو مزيج من بيانات SO و PB. (أ) ، (ب) إظهار النتائج عندما يتم جمع بيانات SO على المنطقة بأكملها B (c) ، (د) تظهر النتائج عندما يتم جمع بيانات SO من منطقة دراسة مقيدة و (هـ) و ( و) كوري-سبوندس إلى احتمال الكشف المنخفض sce-nario. يشير الخط الأفقي إلى القيم الحقيقية للمعلمات b0andb1 ، المستخدمة لإنشاء نقاط البيانات التي تشير إلى متوسط ​​المناطق المظللة في esti-mate يشير إلى فترات الثقة (انحرافان معياريان) ، وتشير الشعيرات إلى أكثر التقديرات تطرفًا لـ 500 تحقيق للمحاكاة البيانات.

تم تمييز المنطقة بمربع في الشكل 1 (الصف العلوي). من الناحية المثالية ، يجب أن تتضمن العينات الممثلة مكانيًا المواقع التي تمتد على نطاق القيم المتغيرة في المنطقة ب. من خلال أخذ عينات بيانات SO في هذه المنطقة المقيدة ، يتم تقليل التباين في المتغيرات المشتركة x (s) و w (s) إلى حد كبير ، مقارنةً بـ بيانات SO المستخدمة في تحليلاتنا السابقة. وبالتالي ، نحن مهتمون بتحديد كيفية تأثير هذا التقييد على نجاح Inte-grated SDM.

تظهر النتائج في المخططات الصندوقية للشكل 2 ج و د لـ 200 موقع من مواقع SO. لكلاهما ب0وب1، فإن أداء SDM المتكامل يفقد قليلًا نسبيًا في الأداء عند الانتقال من أخذ عينات بيانات SO على المنطقة B بأكملها إلى أخذ عينات من المنطقة المصغرة. تم تكرار هذه العملية باستخدام مجموعة من المواضع المكانية المختلفة لاختيار المنطقة المحظورة (على الرغم من اعتبارها دائمًا بنفس الحجم) ، ووجد أن هذه النتيجة قوية جدًا (انظر دعم المعلومات). يشير هذا إلى كيفية إمكانية تضمين منطقة فرعية متجاورة صغيرة من الناحية العملية لبيانات SO واستخدام ذلك لتحسين أداء SDM بشكل كبير مع نموذج بيانات PB وحده.

L O W DE T E C T IO N P R O B A B IL IT Y

من المثير للاهتمام فحص الحالة عندما تكون احتمالية الكشف على المنطقة B منخفضة نسبيًا. ينتج عن هذا عدد قليل من الملاحظات للأنواع فوق المناظر الطبيعية ويضع النموذج في نظام يصعب فيه تقدير المعلمات. عندما يكون احتمال الاكتشاف منخفضًا ، فإن وظيفة اللوغاريتم لـ b (s) تقترب عن كثب من دالة لوغاريتمية خطية ، بحيث يكون لعملية التخفيف كثافة

نتيجة لذلك ، قد يكون من الممكن تقدير الكتل المجمعة0þ a0 ، لكن من المستحيل فصل الفرد

تقديرات ب0 anda0 باستخدام بيانات PB وحدها (Dorazio 2012

فيثيان وأمبير هاستي 2013 دورازيو 2014). ومع ذلك ، وجدنا أنه من الممكن التغلب على هذه المشكلة من خلال العمل مع SDM المتكامل ، في حالة توفر كمية صغيرة نسبيًا من بيانات SO.

على سبيل المثال ، ضع في اعتبارك معلمات تسجيل الدخول التالية لاحتمال (ب) اكتشاف المعلمات:

هذا الاختيار المحدد للعملات ða0 ¼ 3 a1 ¼ 1Þ

ينتج عن احتمال متوسط ​​أقل للكشف عن bðsÞ ¼ 0 06 ، مقارنة بـ bðsÞ Þ 0308 في القسم السابق.

يوضح الشكل 2 هـ ، و النتائج التي تم الحصول عليها عند تكرار تحليلنا باحتمال اكتشاف منخفض. في الشكل 2 هـ ، نرى أن التقديرات لـ b0من بيانات PB البحتة الآن لها فاصل ثقة كبير يشير إلى المشكلة الجوهرية لنموذج PB في تقدير التقاطع b0. لكن هذا أصبح أكثر

مبالغ فيها الآن لأن قابلية الكشف منخفضة. ومع ذلك ، كما كان من قبل ، ب1لا يزال من الممكن تقديرها بدقة من بيانات PB النقية ، كما هو موضح في الشكل 2f. ومع ذلك ، فإن تحويل نفس بيانات قابلية الاكتشاف المنخفضة باستخدام SDM المتكامل يؤدي إلى تحسينات مهمة لتقديرات ب.0، وقد حققوا نفس الدقة تقريبًا لنتائجنا السابقة بناءً على قابلية اكتشاف أعلى (الشكل 2 أ).

C O R R E L A T E D C O V A R IA T E S

عادةً ما تكون المتغيرات المشتركة البيئية مثل درجة الحرارة والارتفاع مرتبطة ارتباطًا وثيقًا ، لكن تحليلنا حتى الآن يفترض أن المتغيرات المشتركة المستخدمة في النموذج مستقلة. لقد حذر عدد من الدراسات من أن المتغيرات المشتركة المرتبطة يمكن أن تؤدي إلى مشاكل عند تقدير المعلمات (Dorazio 2012 Dor-mann، Elith & amp Bacher 2013 Fithian & amp Hastie 2013 Dorazio 2014). هنا ، وجدنا ذلك لكل من نموذج PB و

الشكل 3. التحيز والانحراف المعياري لتقديرات احتمالية maxi-mum لمعلمات النموذج b0andb1 مع أعداد متفاوتة من مواقع شغل الموقع (SO). يُظهر الصف العلوي نتائج نموذج التواجد-الخلفية (PB) ونموذج توزيع الأنواع المتكامل كدالة لعدد مواقع SO المضافة. يتوافق نموذج PB النقي مع إضافة مواقع SO "صفر". يُظهر الصف السفلي نموذج SO كدالة لنفس عدد المواقع. تشير الرموز إلى بيانات PB (مثلثات) ، أو بيانات SO (دوائر) ، أو دمج بيانات PB بكميات متفاوتة من بيانات SO (المربعات) تتراوح من 50 موقعًا إلى 800. تتوافق المناطق المظللة مع فاصل الاتصال 95٪ ( اثنين من الانحرافات المعيارية) لاحظ فاصل الثقةب 1لبيانات PB أصغر من حجم رمز المثلث. يشير الخط الأحمر إلى القيم الحقيقية للمعلمات.

بشكل عام ، لا تتغير تقديرات المعلمات SDM المتكاملة عندما تكون المتغيرات المشتركة x (s) و w (s) مترابطة ، إلا عندما يقترب الارتباط بين المتغيرات المشتركة واحدًا (انظر المعلومات الداعمة للحصول على وصف للطريقة المستخدمة لإنشاء المتغيرات المشتركة المرتبطة). في الشكل 4 ، نعرض تقديرات الأصحاب ب0وب1كدالة للارتباط ، r ، بين المتغيرات البيئية المشتركة x (s) و w (s). تم إجراء هذه التقديرات باستخدام نموذج PB (مثلثات) و SDM المتكامل (المربعات) (مع نتائج 100 موقع SO موضحة في الشكل 4). الارتباط r له تأثير ضئيل على هذه التقديرات ، وفي أسوأ الأحوال يقلل قليلاً من التقدير ب0لـ SDM المتكامل. في الواقع ، يقل هذا التحيز بشكل كبير مع زيادة عدد مواقع SO (انظر الشكل S4). لاحظ أيضًا الملاحظة المهمة التي مفادها أن SDM المتكامل يتفوق على نموذج PB على جميع مستويات الارتباط بين المتغيرات المشتركة.

طائرة شراعية صفراء البطن في أستراليا: تطبيق SDM متكامل

لإثبات منهجيتنا باستخدام بيانات حقيقية ، قمنا بتطوير SDMs للطائرة الشراعية ذات اللون الأصفر (Petaurus australis) في جنوب شرق أستراليا باستخدام بيانات PB و SO. إن طائرة شراعية صفراء البطن هي جرابي شجري ليلي مزلقة تعيش في غابات الأوكالبتوس الأصلية في شرق أستراليا ، ويتراوح توزيعها من فيكتوريا في الجنوب إلى شمال كوينزلاند. تم إجراء التحليل باستخدام منطقة دراسة تجمع بين النطاق الجنوبي للأنواع داخل ولاية فيكتو-ريا ، أستراليا (انظر الشكل S11). تم تحديد منطقة الدراسة بواسطة المناطق الحيوية في فيكتوريا التي لها وجود مسجل واحد على الأقل للأنواع في مجموعة بيانات PB أو SO (انظر الشكل S11).

تم الحصول على بيانات PB لمنطقة دراستنا من أطلس Victo-rian للتنوع البيولوجي (http://www.delwp.vic.gov.au/environment-and-wildlife / التنوع البيولوجي / الفيكتوري-التنوع البيولوجي-أطلس). استبعدنا السجلات قبل عام 2000 ، مما أدى إلى وجود 1136 موقعًا بتواريخ تتراوح من عام 2000 إلى 2012 ، والتي تم استخدامها بعد ذلك لنموذج PB (eqn 3). تم جمع بيانات SO كجزء من المسوحات المخطط لها التي استهدفت تسعة أنواع ذات أولوية عالية في منطقة اتفاقية الغابات الإقليمية في المرتفعات الوسطى في فيكتوريا من قبل وزارة البيئة والأراضي والمياه والتخطيط (DELWP).

تم إجراء الاستطلاعات في خريف عام 2012 في 202 موقع مع تكرار كل مسح مرتين في كل موقع ، مما يسمح بتقدير تأثيرات الكشف عن العيوب [لمزيد من التفاصيل ، انظر Lumsden، Nelson & amp Todd (2013)]. تم اكتشاف طائرات شراعية صفراء البطن في 29 موقعًا خلال أول سور في و 22 موقعًا في الثانية Sursur-vey. بشكل عام ، كان عدد المواقع التي بها اكتشاف واحد على الأقل للأنواع 38. تم استخدام بيانات SO هذه في نموذج SO (eqn 7) ، وتم استخدام بيانات SO و PB معًا في SDM Inte-grated ( eqn 8).

يُفترض أن كثافة (أو الكثافة المتوقعة) k (s) للطائرات الشراعية ذات البطون الصفراء تعتمد على 12 تباينًا متغيرًا مكانيًا: الارتفاع ، ودرجة الحرارة الدنيا في يوليو ، والحد الأقصى لدرجة الحرارة في يناير ، والمسافة إلى التيار الرئيسي ، ومؤشر الرطوبة ، التبخر في شهري يناير ويوليو ، وعدد أيام المطر في شهري يناير ويوليو ، وهطول الأمطار في يناير ويوليو ، والسماء المرئية. تم تجميع القيم المقاسة لكل متغير مشترك للحصول على دقة متسقة تتكون من 100 متر بكسل (انظر معلومات الدعم للحصول على تفاصيل المتغيرات المشتركة). يُفترض أن الاكتشاف في بيانات PB يعتمد على متغيرين مشتركين: المسافة إلى الطريق ووعورة التضاريس ، والتي يُعتقد أنها تلعب أدوارًا مهمة في تحديد جهد أخذ العينات للسور الانتهازي (Fithian et al. 2015 Fletcher et al. 2016) ( انظر المعلومات الداعمة). لاحظ أننا نفترض هنا أن الاكتشاف في نموذج PB يتضمن كلاً من التحيز المكاني في جهد البحث واحتمال اكتشاف النوع بواسطة المراقب ، كما هو موضح سابقًا. يُفترض أن الاكتشاف في بيانات SO يعتمد على قوة الرياح ووقت المسح خلال اليوم (Lumsden، Nelson & amp Todd 2013).

تظهر خرائط الكثافة المتوقعة للطائرة الشراعية ذات اللون الأصفر في الشكل 5 لكل من PB و SDMs المتكاملة. تُظهر الخرائط أن الطائرة الشراعية ذات البطون الصفراء تميل إلى الحدوث في المناطق الرطبة والوعرة والغابات كما هو مقترح في Lumsden و Nelson & amp Todd (2013). توضح مقارنة PB و SDM المتكامل أن إضافة بيانات SO تخلق مجموعة من التغييرات الطفيفة على نموذج PB. يكشف SDM المتكامل عن تقديرات أعلى للكثافة في المناطق الجنوبية الغربية والشرقية من منطقة الدراسة وتقديرات أقل للكثافة في معظم المناطق الجنوبية والشمالية (انظر الشكل S15 للحصول على خريطة للاختلاف بين النموذجين).

الشكل 4. التحيز والانحراف المعياري لتقديرات الاحتمالية القصوى لمعلمات النموذج b0andb1 تحت مقادير مختلفة من الارتباط بين المتغيرات المشتركة. وتشير الرموز التي تقديرات تم الحصول عليها عن طريق فاي tting نموذج فقط مع وجود-الخلفية (PB) البيانات (المثلثات)، أو عن طريق فاي tting نموذج المتكاملة توزيع الأنواع (SDM) مع البيانات الإشغال الموقع إضافية (المربعات) التي تم جمعها في 100 مواقع بدرجات متفاوتة من الارتباط بين المتغيرات المشتركة x (s) و w (s). تتوافق المناطق المظللة والمتقطعة مع فاصل الثقة 95٪ (انحرافان معياريان) في تقديرات PB و SDMs المتكاملة على التوالي.

لتقييم أداء SDMs ، تم تقسيم مجموعة بيانات PB و SO المدمجة إلى مجموعات فرعية للتدريب والاختبار. تم تمهيد مجموعة البيانات لأول مرة 100 مرة ، مع كل نموذج SDM - تم تحويله إلى 80 ٪ من بيانات SO و / أو PB (تم اختيارها عشوائيًا) في كل من bootstraps. لإنشاء مجموعة بيانات اختبار بأعداد مماثلة من التواجد والغياب ، تم استخدام النهج التالي: لكل تمهيد ، تم استكمال الـ 20٪ المتبقية من SO بنقاط مختارة عشوائيًا من مجموعة اختبار بيانات PB حتى كان هناك عدد متساوٍ من العروض و abspres-ences في بيانات الاختبار التي تشتمل على بيانات SO و PB. عدد حالات التواجد والغياب في مجموعة بيانات PB و SO المدمجة غير متوازن إلى حد كبير: 1136 حالة تواجد من PB مقارنة بـ 164 حالة غياب من مجموعات بيانات SO.

لتقييم أداء النموذج على البيانات الحقيقية ، تم تحويل الكثافة المتوقعة لموقع الاختبار إلى احتمال الإشغال ، باستخدام eqn 6. تم تصنيف مواقع الاختبار على أنها "حالية" أو "غائبة" ، اعتمادًا على عتبة قيمة لاحتمال الحدوث (الذي كان متنوعًا). تم تقييم النماذج باستخدام منحنيات ROC ، وهي طريقة شائعة الاستخدام لتقييم أداء نماذج البيانات الثنائية (Fawcett 2006) ، والتي تأخذ في الاعتبار النطاق الكامل للقيم القديمة المحتملة. تم قياس دقة تنبؤ النموذج بالمنطقة الواقعة تحت منحنى ROC (AUC). ال 100 حذاء بوتسترابس

تم استخدامها للحصول على الخطأ القياسي في تقديرات AUC لـ PB و SO و SDM المتكامل SDM.

يوضح الشكل 5 مخططًا لمتوسط ​​AUC لـ PB و SO و SDM المتكامل ، محسوبًا من 100 bootstraps. تظهر النتائج أن SDM المتكامل لديه تنبؤ أفضل لكل شكل كما تم قياسه بواسطة AUC من PB لـ SO mod-els ، وكلاهما يعمل بشكل مشابه (SO = 0 560 PB = 0569 ، متكامل = 0617 الشكل 5).

لقد استخدمنا عملية نقطة مكانية غير متجانسة لبناء SDM متكامل ، أي أن لكل من بيانات PB و SO في وقت واحد وصالحة للمساحة المستمرة. يستخدم برنامج SDM الداخلي الخاص بنا استطلاعات SO متكررة لتقدير وحساب تأثيرات الكشف غير الكامل في تلك الاستطلاعات. نهجنا هو امتداد لذلك الذي اقترحه Dorazio (2014) ، الذي صاغ نموذجًا للتهم المتكررة (أي اكتشاف الحيوانات الفردية) في كل موقع. يختلف عملنا عن مناهج Fithian et al. (2015) و Fletcher et al. (2016) لأن نماذجهم لا تتضمن بيانات SO متكررة ولا تحاول حساب تأثيرات الكشف غير الكامل في استطلاعاتهم.

الشكل 5. خلفية التواجد (PB) ونماذج التوزيع المتكاملة للأنواع (SDMs) الناتجة عن بيانات الطائرات الشراعية ذات اللون الأصفر في فيكتوريا ، أوس تراليا (الخرائط على اليسار). تعرض الخرائط تقديرات لكثافة PB (اللوحة العلوية) و SDM المتكامل (اللوحة السفلية). تُظهر المؤامرة الموجودة على اليمين المنطقة الواقعة أسفل منحنى ROC (AUC) لـ PB ، وإشغال الموقع (SO) و SDM المتكامل. تم حساب متوسط ​​القيم على أكثر من 100 إعادة تصميم تمهيد. تشير الدوائر إلى متوسط ​​قيمة AUC ، بينما تتوافق أشرطة الخطأ مع الأخطاء القياسية.

يلخص الشكل 3. أول استنتاجاتنا الرئيسية. وهناك نرى أن نموذج PB غير قادر على تقدير الاحتمال الحقيقي للشغل بسبب عدم قدرته على تقدير التقاطع b0 (الشكل 3 أ). تقديرات b0 متحيزة وذات ارتفاع نسبيًا

التباين ، وقد يُنظر إلى هذا على أنه العيب الرئيسي لنموذج PB. ومع ذلك ، فإن نموذج PB قادر على تقدير المنحدر ب1 بدون تحيز وبتغير صغير نسبيًا (الشكل 3 ب). وبالمثل ، يوفر نموذج SO وحده تقديرات لـ b0 مع القليل من التحيز والتباين الصغير نسبيًا. ومع ذلك،

تقديرات ب1غالبًا ما تكون غير موثوقة بسبب تباينها المرتفع نسبيًا الناتج عن حجم العينة المحدود لمواقع SO (الشكل ثلاثي الأبعاد). بعد مقارنات دقيقة ، خلصنا إلى أن SDM المتكامل دائمًا ما يكون متفوقًا دائمًا في قدرته على تقدير المعلمات من نموذج PB أو نموذج SO. بعبارات بسيطة ، يرث SDM المتكامل المزايا الرئيسية لكل من النماذج الأخيرة بمفرده ، ويقلل من عيوبها. وبالتالي ، فإن SDM المتكامل ينتج تقديرات غير متحيزة للمعلمات ب0وب1، وكلاهما لهما قدرة متغيرة منخفضة (الشكل 3 أ ، ب). تم العثور على SDM المتكامل أيضًا على أداء متفوق في تحليل البيانات الحقيقية التي تم جمعها للطائرة الشراعية ذات اللون الأصفر ، في فيكتوريا ، أستراليا (الشكل 5).

يحتوي SDM المتكامل على عدد من العلاقات المناسبة المفيدة الأخرى. على سبيل المثال ، الارتباطات بين covari-ates البيئية x (s) و w (s) التي تتحكم في الكثافة k (s) والكشف b (s) ، على التوالي ، لها تأثير ضئيل على تقدير معلمات النموذج. يتناقض هذا مع الدراسات الرئيسية الأخرى في الأدب (Dorazio 2014 Fithian et al. 2015). أيضًا ، كان أداء SDM المتكامل جيدًا حتى عندما كانت مواقع SO موجودة في منطقة مقيدة جغرافيًا ، لا تغطي سوى جزء صغير من نطاق القيم المتغيرة في المنطقة B.

كان الهدف من تحليل البيانات الحقيقية المقدمة هنا هو إثبات المفهوم بهدف اختبار ما إذا كان الأداء المتفوق لـ SDM المتكامل واضحًا باستخدام بيانات حقيقية. ومع ذلك ، فقد حددت بعض التحديات الرئيسية التي تحتاج إلى أخذها في الاعتبار عند العمل مع مجموعات بيانات حقيقية.في حالة بيانات SO الخاصة بنا للطائرة الشراعية ذات اللون الأصفر ، فإن العدد الأصغر من المواقع المتاحة (ن = 202) والعدد الأكبر من الغياب الظاهر للأنواع (عدم الاكتشاف) جعل من الصعب تقييم قدرة ما قبل الإملاء للطائرة الشراعية. تم دمج SDM بشكل هادف ، وقمنا بحل هذا التحدي من خلال إنشاء مجموعة بيانات تقييم من كل من بيانات PB و SO كما هو موضح أعلاه. هناك مشكلة أخرى عند العمل مع SDM المتكامل ، والمشترك في هذه الأنواع من النماذج المعقدة ، وهي الحاجة إلى تحديد ثلاث مجموعات مختلفة من المتغيرات المشتركة بشكل صحيح من أجل (1) الكثافة ، k (s) ، في نموذج PB ، (2) الكشف غير الكامل ، b (s) ، في نموذج PB ، و (3) الكشف غير الكامل ، pijðsÞ ، في مجموعة بيانات SO. هذا قد يخلق تحديات

لاختيار النموذج ، من حيث تحديد المتغيرات المشتركة التي سيتم استخدامها في كل مكون من مكونات النموذج. أخيرًا ، يعتمد النموذج على توزيع بواسون كجزء من عملية IPP. هذا يفترض أنه لا يوجد ارتباط مكاني صفري في تواجد الأنواع ، وهو افتراض قد لا يصمد بسبب الارتباط التلقائي من الأنواع والتفاعلات البيئية والتجمعات الطبيعية. علاوة على ذلك ، غالبًا ما تُظهر بيانات PB تجميعًا نسبيًا لتوزيع بواسون (على سبيل المثال بسبب عدم وجود تنبؤات). يمكن أن تكون إحدى الطرق لمعالجة هذه المشكلات هي استخدام نموذج عملية كوكس. ومع ذلك ، فإن هذا يطرح العديد من التحديات وهو خارج نطاق دراستنا.

افتراض آخر مهم لنموذجنا هو أن نمط النقطة المرصودة ثابت أو أن الأنواع التي تحدث داخل الموقع لا تغادر (أو تدخل من موقع آخر) أثناء جمع البيانات. من المحتمل أن يتم إرضاء هذا الافتراض بالنسبة للأنواع التي تكون حركاتها محدودة (النباتات ، الجرابيات الصغيرة ، البرمائيات الصغيرة ، إلخ) ، ولكن قد يتم انتهاكها بالنسبة للأنواع عالية الحركة (الثدييات الكبيرة ، والطيور ، وما إلى ذلك).

يتمثل أحد الجوانب الجديدة لعملنا في تضمين نموذج إشغال قائم على الوفرة لنمذجة توزيع الأنواع. تعتمد غالبية نماذج الإشغال المستخدمة في SDM على النماذج التقليدية المعتمدة على المقياس (K ery و Gardner و amp Mon-nerat 2010 K ery & amp Royle 2016). تُستخدم هذه النماذج التقليدية بشكل متزايد في تطبيقات SDM نظرًا لتوفر حزم R. ومع ذلك ، فإن معلمات هذه النماذج تعتمد على الدقة المكانية للبيانات ، مما يحد من استباق حدوث الأنواع إلى هذا القرار. في المقابل ، يمكن استخدام نماذج الإشغال القائمة على الوفرة للتنبؤ بوفرة أو حدوث الأفراد في أي مقياس مكاني. يعتمد SDM المتكامل الخاص بنا على نموذج عملية النقطة المكانية ، والتي تكون معلماتها ثابتة على المقياس المكاني. وبالتالي ، يتم تحديد دالة (وظائف) الكثافة على مساحة مستمرة في المنطقة B ، مما يجعل من الممكن تقدير وفرة أو عدد تكرارات الأفراد في أي منطقة فرعية من B ، على الرغم من حقيقة أن النموذج يستخدم بيانات SO في مواقع منفصلة. هذا المنفعة وثيق الصلة بتوزيعات الأنواع المصغرة أو توسيع نطاقها ، وهو موضوع الاهتمام الحالي بنمذجة توزيع الإحساس (Keil، Wilson & amp Jetz 2014).

تم إجراء جميع التحليلات بواسطة V.K. كانت النظرية الأساسية وتصميم المحاكاة وكتابة المخطوطة نتيجة تعاون بين V.K. و Y.W. و A.G. و R.D. و L.S. تم توفير البيانات الميدانية بواسطة M.W. وتحليلها بواسطة V.K. مع مدخلات من M.W.

إن دعم منحة مجلس البحوث الأسترالي DP150102472 نقدره بامتنان.

كان P.B. يتم الحصول على بيانات الأنواع من Atlas of Living Australia ، وهي متاحة للجمهور. يمكن تنزيل الأحداث من الموقع goo.gl/NwELPz. يتم أرشفة بيانات إشغال الموقع والمتغيرات المشتركة المستخدمة في التحليل ويمكن تنزيلها على https://doi.org/10.5061/dryad.8467g (Koshkina et al. 2017). يمكن العثور على البرامج النصية R المستخدمة لإنشاء بيانات محاكاة وبيانات أخرى في معلومات الدعم.

Baddeley، A.، Rubak، E. & amp Turner، R. (2015) Spatial Point Patterns: Methodology and Applications with R. CRC Press، Boca Raton، FL، USA.

تشاكرابورتي ، A. ، Gelfand ، A.E. ، Wilson ، A.M. ، Latimer ، A.M. & amp Silander، J.A. (2011) نمذجة نمط النقاط لبيانات الحضور المتدهور فقط عبر مناطق كبيرة. مجلة الجمعية الإحصائية الملكية: السلسلة ج (الإحصاء التطبيقي) ، 60 ، 757-776.

كريسي ، إن. (2015) إحصاءات البيانات المكانية. John Wiley & amp Sons ، نيويورك ، نيويورك ، الولايات المتحدة الأمريكية.

دورازيو ، ر. (2012) توقع التوزيع الجغرافي للأنواع من بيانات الوجود فقط المعرضة لأخطاء الكشف. القياسات الحيوية ، 68 ، 1303-1312. دورازيو ، ر. (2014) المحاسبة عن الكشف غير الكامل وتحيز المسح

تحيز المسح في بيانات الحضور فقط. الإيكولوجيا العالمية والجغرافيا الحيوية ، 23 ، 1472–1484.

دورمان ، سي إف ، إليث ، جي ، باشر ، إس وآخرون. (2013) العلاقة الخطية المتداخلة: مراجعة منهجيات التعامل معها ودراسة محاكاة لتقييم أدائها. Ecog-raphy ، 36 ، 27-46.

Elith، J. & amp Leathwick، J.R. (2009) نماذج توزيع الأنواع: التفسير البيئي والتنبؤ عبر المكان والزمان. المراجعة السنوية للإيكولوجيا والتطور والنظاميات ، 40 ، 677-697.

Fawcett، T. (2006) مقدمة لتحليل ROC. رسائل التعرف على الأنماط ، 27 ، 861-874.

Fithian، W. & amp Hastie، T. (2013) تكافؤ العينة المحدودة في النماذج الإحصائية لبيانات الحضور فقط. حوليات الإحصاء التطبيقي ، 7 ، 1917-1939.

فيثيان ، دبليو ، إليث ، جيه ، هاستي ، ت. وأمبير كيث ، دي إيه. (2015) تصحيح التحيز في نماذج توزيع الأنواع: تجميع بيانات المسح وجمع الأنواع المتعددة. طرق في علم البيئة والتطور ، 6 ، 424-438.

فليتشر ، R.J. ، McCleery ، R.A. ، Greene ، D.U. & أمبير تاي ، C.A. (2016) النماذج المتكاملة التي توحد البيانات المحلية والإقليمية تكشف عن علاقات بيئية واسعة النطاق وتحسن التنبؤات بتوزيع الأنواع. المناظر الطبيعية Ecol-ogy ، 31 ، 1369–1382.

Guillera-Arroita، G.، Lahoz-Monfort، J.J.، MacKenzie، D.I.، Wintle، B.A. وأمبير مكارثي، M.A .. (2014) تجاهل الكشف عن الكمال في البحوث البيولوجية خطير: ردا على "tting فاي وتفسير نماذج الإشغال. بلوس وان ، 9 ، e99571.

Guillera-Arroita، G.، Lahoz-Monfort، J.J.، Elith، J.، Gordon، A.، Kujala، H.، Len-tini، P.E.، McCarthy، MA، Tingley، R. & amp Wintle، B.A. (2015) هو بلدي الأنواع نموذج التوزيع فاي ر لهذا الغرض؟ مطابقة البيانات والنماذج مع التطبيقات: مطابقة نماذج التوزيع مع التطبيقات. الإيكولوجيا العالمية و Biogeogra-phy ، 24 ، 276-292.

Hastie، T. & amp Fithian، W. (2013) الاستدلال من بيانات الحضور فقط الجدل المستمر. علم البيئة ، 36 ، 864-867.

وإرنست و يونغ FL، T.J. & amp Hooten ، M.B. (2016) نماذج توزيع هرمي للأنواع. تقارير إيكولوجيا المناظر الطبيعية الحالية ، 1 ، 87-97.

Iknayan ، K.J. ، Tingley ، M.W. ، Furnas ، B.J. & amp Beissinger ، S.R. (2014) الكشف عن التنوع: الأساليب الناشئة لتقدير تنوع الأنواع. الاتجاهات في علم البيئة وتطور أمبير ، 29 ، 97-106.

Keil، P.، Wilson، A.M. & amp Jetz، W. (2014) عدم اليقين والأحداث السابقة والارتباط التلقائي والبيانات المتباينة في تصغير توزيعات الأنواع. التنوع والتوزيع ، 20 ، 797-812.

K ery، M. & amp Royle، J.A. (2016) النمذجة الهرمية التطبيقية في علم البيئة. المطبعة الأكاديمية ، لندن ، المملكة المتحدة.

K ery، M.، Gardner، B. & amp Monnerat، C. (2010) التنبؤ بتوزيعات الأنواع من بيانات قائمة التحقق باستخدام نماذج إشغال الموقع. مجلة الجغرافيا الحيوية ، 37 ، 1851-1862.

Koshkina، V.، Wang، Y.، Gordon، A.، Dorazio، R.، White، M. & amp Stone، L. (2017) احتلال البيانات مع الكشف غير الكامل. مستودع درياد الرقمي ، https://doi.org/10.5061/dryad.8467g

لي ، إيه جيه ، سكوت ، إيه جيه. & amp Wild، CJ (2006) تركيب نماذج الانحدار الثنائي مع عينات مكبرة الحالة. بيوميتريكا ، 93 ، 385-397.

Lumsden ، LF ، نيلسون ، جيه إل ، تود ، سي آر وآخرون. (2013) نهج استراتيجي جديد لإدارة التنوع البيولوجي - مكون البحث. معهد آرثر ريلا لأبحاث البيئة تقرير عميل غير منشور لوزارة البيئة والصناعات الأولية ، ملبورن.

MacKenzie ، D.I. ، Nichols ، J.D. ، Lachman ، G.B. ، Droege ، S. ، Andrew Royle ، J. & amp Langtimm ، C.A. (2002) تقدير معدلات إشغال الموقع عندما تكون احتمالات الكشف أقل من واحد. علم البيئة ، 83 ، 2248-2255.

بيرس ، جيه إل وأم بويس ، إم إس. (2006) توزيع النمذجة والوفرة باستخدام بيانات الحضور فقط. مجلة علم البيئة التطبيقية ، 43 ، 405-412.

فيليبس ، S.J. ، أندرسون ، R.P. & amp Schapire ، R.E. (2006) نمذجة الانتروبيا القصوى للتوزيعات الجغرافية للأنواع. النمذجة البيئية ، 190 ، 231-259.

رينر ، آي دبليو وأمبير وارتون ، دي. (2013) تكافؤ نماذج عملية نقطة MAXENT و poisson لنمذجة توزيع الأنواع في علم البيئة: equiva-lence لنماذج عملية MAXENT و poisson. القياسات الحيوية ، 69 ، 274-281.

رينر ، آي دبليو ، إليث ، جي ، باديلي ، إيه ، فيثيان ، دبليو ، هاستي ، تي ، فيليبس ، إس جي ، بوبو فيك ، جي أند آبير وارتون ، دي. (2015) نماذج عملية النقاط لتحليل الحضور فقط. طرق في علم البيئة والتطور ، 6 ، 366-379.

رويال ، ج. & amp Dorazio ، R.M. (2008) النمذجة والاستدلال الهرمي في Ecol-ogy: تحليل البيانات من السكان ، والتجمعات السكانية والعلاقات المجتمعية. المطبعة الأكاديمية ، لندن ، المملكة المتحدة.

Tyre، A.J.، Tenhumberg، B.، Field، SA، Niejalke، D.، Parris، K. & amp Possing-ham، H.P. (2003) تحسين الدقة وتقليل التحيز في الصور البيولوجية: تقدير معدلات الخطأ السلبي الكاذب. التطبيقات البيئية ، 13 ، 1790-1801.

وارتون ، دي. & أمبير شيبرد ، إل. (2010) نماذج عملية نقطة بواسون تحل "مشكلة الغياب الزائف" لبيانات الوجود فقط في البيئة. حوليات الإحصاء التطبيقي ، 4 ، 1383-1402.

تم استلامه في 14 تشرين الثاني (نوفمبر) 2016 وتم قبوله في 5 كانون الأول (ديسمبر) 2016 معالجة المحرر: ديفيد وارتون

يتم توفير تفاصيل معلومات الدعم الإلكترونية أدناه. الملحق S1. تفاصيل عن محاكاة المتغيرات المشتركة ، نتائج محاكاة إضافية ، شرح مفصل لتحليل بيانات حقل الطائرة الشراعية الصفراء.

البيانات S1. تم استخدام البيانات المولدة (المتغيرات المشتركة x و w ومجموعات البيانات PB و SO) في النماذج.

البيانات S2. النصي R لPB فاي tting، SO والنماذج المتكاملة للبيانات. البيانات S3. البرنامج النصي R لإنشاء البيانات المحاكاة (المتغيرات المشتركة x و w ومجموعات البيانات PB و SO).


SDMs مماثلة للوظائف الموجية للجسيمات الكمومية

في ميكانيكا الكم ، أي جسم (مثل الجسيم) يتميز "بالدالة الموجية". حتى يتم ملاحظة الكائن مباشرة (أي ، قياسه) ، لا يمكن القول أنه يحتوي على موقع محدد في المكان أو الزمان ، ولكن بدلاً من ذلك يمكن اعتباره احتمال وجوده في عدد من المواقع في وقت واحد ، كما هو موضح في الدالة الموجية. تتفاعل الأجسام الكمومية المتماسكة بناءً على وظائفها الموجية بدلاً من التفاعل المباشر مع احتمالات حدوثها. إن السعة التربيعية للدالة الموجية الموضعية في موقع معين هي التي تعطي احتمالية حدوث الكائن الذي يتم ملاحظته عند تلك النقطة في الفضاء. بمجرد ملاحظة الكائن فعليًا ، "تنهار" الدالة الموجية في عملية لم يتم فهمها بالكامل بعد ، ويمكن بعد ذلك العثور على الكائن مؤقتًا فقط في ذلك الموقع الفردي المعروف (في نظرية الكم ، أصبح الكائن "غير متماسك" Zurek 1991). بمرور الوقت ، إذا لم يتم قياسه مرة أخرى ، يصبح الجسم متماسكًا ، وموقعه الدقيق مرة أخرى غير مؤكد.

على الرغم من أن كلا من الاحتمالية والتفضيل يتراوح من 0 إلى 1 ، إلا أنهما يختلفان في جانب أساسي. يتأثر احتمال حدوث نوع في موقع ما بالانتشار العام للأنواع والدرجة التي تجعل ظروف ذلك الموقع المحدد حدوث الأنواع أكثر أو أقل احتمالًا. الأفضلية هي بالضبط هذا الجزء الثاني. إذا كان موقع معين مناسبًا ، فحينئذٍ | $ P $ | في هذا الموقع أعلى مما يمكن أن يعزى إلى الانتشار العام للأنواع وحدها. على العكس من ذلك ، يمكن أن تنشأ احتمالية عالية لحدوثها في ظروف منخفضة الأفضلية إذا كان معدل الانتشار العام مرتفعًا. | $ P $ | و | $ F $ | تمثل مفاهيم فلسفية مختلفة ، وأنظمة منطقية (منطق واضح وضبابي ، على التوالي) ، ومجالات رياضية - وتؤدي إلى نتائج مختلفة ، وإن كانت مكملة مرات عديدة. تصف وظيفة الأفضلية التفضيل المحلي لحدوث الأنواع في جميع المناطق بطريقة مستقلة عن انتشار الأنواع ، وهي المحرك الأساسي لتوزيع الأنواع التي تستمد منها بيانات التوزيع المرصودة. لذلك نعتبرها مماثلة لدالة موجة الجسيم.

لإجراء تشبيه ثانٍ بين الأفضلية والوظائف الموجية ، أظهر Acevedo و Real (2012) أن التفاعل بين التفضيلات ، وليس بين احتمالات الحدوث ، هو الذي يتيح الجمع بين SDMs عندما تشارك عدة أنواع. وبالمثل ، فإن التفاعل بين الأجسام الكمومية يعتمد على وظائفها الموجية وليس على الاحتمالات الخاصة بالأجسام التي يتم رصدها.

تعكس وجهة النظر هذه أيضًا توزيعات الأنواع بشكل أفضل من الفهم الثابت للملاحظات. لا يمكن لأي خريطة للتوزيع المرصود أن تدعي أنها تمثل توزيع الأنواع بشكل كامل ، ولكن فقط سلسلة من الملاحظات الناتجة عن التوزيع الحقيقي للأنواع (Barbosa et al. 2013b). أولاً ، يكون توزيع الأنواع ديناميكيًا وليس ثابتًا: حتى بالنسبة للكائنات الحية المستقرة مثل النباتات أو الشعاب المرجانية ، يتغير التوزيع الجغرافي بمرور الوقت على نطاقات مكانية متعددة. الاختلافات بين الكائنات الحية المتحركة والمستقرة في هذا الصدد كمية وليست نوعية. نطاق توزيع الأنواع هو تعبير عن مدى استجابته المستمرة (والمتغيرة) للظروف البيئية المتغيرة (Hengeveld 1992). ثانيًا ، وبالتالي ، في أي نقطة زمنية معينة ، تغطي الأنواع مجموعة من المواقع في وقت واحد مع شدة مختلفة ، في حين أن المكان الدقيق الذي نجد فيه كل فرد يعتمد على اللحظة الدقيقة التي نلاحظها فيها. حتى إذا تم جمع سجلات توزيع الأنواع على مدار عدة سنوات ، كما هو الحال غالبًا (على سبيل المثال ، Palomo and Gisbert 2002) ، فإن التوزيع المسجل هو مجرد لقطة لمواقع الكائنات الحية في اللحظات التي تمت ملاحظتها ( على سبيل المثال ، النقاط السوداء في الشكل 1). سيتم الحصول على مواقع مختلفة إذا تم إجراء الملاحظات في لحظات مختلفة. وبالتالي يمكن القول أنه ، من الناحية المفاهيمية ، يوجد نوع ما بكثافة مختلفة على المنطقة بأكملها التي يغطيها النطاق الأصلي للأفراد المكونين له ، حيث أن المنطقة بأكملها تتمتع بدرجة غير مهملة من الأفضلية لوجود الأنواع (على سبيل المثال ، المناطق الرمادية في الشكل 1).

سجلات التوزيع (النقاط السوداء) للأرنب الأوروبي (Oryctolagus cuniculus) على UTM | $ 10 < rm km> times 10 < rm km> $ | مربعات من البر الرئيسي لإسبانيا (Palomo and Gisbert 2002) ، والأفضلية البيئية (تزداد من الأبيض إلى الأسود) بناءً على نموذج التوزيع (Real et al. 2009). سجلات التكرار مماثلة لوجهة النظر الكلاسيكية لتوزيع الأنواع ، في حين أن الأفضلية مماثلة لعرض ميكانيكي الكم (الدالة الموجية) لتوزيع الأنواع.

سجلات التوزيع (النقاط السوداء) للأرنب الأوروبي (Oryctolagus cuniculus) على UTM | $ 10 < rm km> times 10 < rm km> $ | مربعات من البر الرئيسي لإسبانيا (Palomo and Gisbert 2002) ، والأفضلية البيئية (تزداد من الأبيض إلى الأسود) بناءً على نموذج التوزيع (Real et al. 2009). سجلات التكرار مماثلة لوجهة نظر كلاسيكية لتوزيع الأنواع ، في حين أن الأفضلية مماثلة لعرض ميكانيكي الكم (الدالة الموجية) لتوزيع الأنواع.

في نظرية الكم ، تشير الملاحظة التجريبية إلى التفاعل بين وسيلة أخذ القياس (على سبيل المثال ، الفوتون الذي يرتد عن الجسيم الأولي) والجسيم الذي يتم ملاحظته ، مما يغير مسار الجسيم نفسه. نتيجة لذلك ، تؤثر أي ملاحظة على الخصائص التي تتم ملاحظتها. وبالمثل ، يمكننا تصور ملاحظة توزيعات الأنواع في الحقل على أنها تنتج "تغييرًا" في التوزيع الحالي المتصور لتلك الأنواع. عندما نلاحظ ، يتم اكتشافنا من قبل الحيوانات ، ونتيجة لذلك ، تغير المسار أو تتحرك في مكان آخر ، أو نقوم بتحريك التكاثر عند لمس الكائنات لتحديد الهوية ، أو نقوم بتعديل البيئة لجعل المواقع قابلة للوصول جسديًا ، لذلك نغير التوزيع بشكل أساسي نحن المراقبة. ملاحظة: نحن لا ندعي هنا أن مراقبة كائن حي يغير حالته جسديًا على طريقة قطة شرودنغر ، بل نقوم بإجراء تشبيه.

يتيح لنا هذا التشابه مع نظرية الكم أن نذهب إلى أبعد من ذلك: يمكن القول أن هناك بعض درجات الأفضلية ، وإن كانت لا تذكر في كثير من الأحيان ، خارج النطاق المحلي لـ أي محيط. وهذا يعني أن هناك ، من حيث المبدأ ، احتمالًا صغيرًا ولكن غير صفري لملاحظة نوع ما في أي مكان خارج النطاق الذي يعتبر مداها. في الواقع ، يمكن للمرء أن يجادل في أن احتمال وجود فرد (في أي مرحلة من مراحل الحياة) من أي نوع واحد في أي مكان داخل المحيط الحيوي العالمي لا يكون أبدًا صفرًا تمامًا. مرة أخرى ، يمكننا القول أن هذا يعكس الواقع - بالتأكيد فيما يتعلق بالظواهر البيولوجية مثل انتشار التشرد والتشرد (على سبيل المثال ، Gilroy and Lees 2003).

لذلك ، يمكن وصف توزيع أي نوع بشكل أفضل ، بدلاً من تسجيلات الحدوث المرصودة ، من خلال نموذج الأفضلية مثل النموذج الموضح بالمقياس الرمادي في الشكل 1 ، والذي يشير إلى مدى احتمالية العثور على الأنواع في كل منطقة ( بناءً على مدى ملاءمة الظروف لوجودها) في كل مرة نلاحظها. تشبه الأفضلية "دالة الموجة" لكل نوع ، والتي تصف السلوك الديناميكي للتوزيع. كما هو الحال في ميكانيكا الكم ، من المحتمل أن توفر الأفضلية "معلومات كاملة" عن نوع (معلومات كاملة عن موقع الجسيم لا تعني فقط مكانه ، ولكن دالة الموجة التي تصف كل مكان يمكن أن تكون فيه ، ومدى احتمالية وجوده هناك). وبالمثل ، فإن المعلومات الكاملة حول توزيع الأنواع ليست في المكان الذي تمت ملاحظته فيه ، ولكن الأماكن التي يمكن ملاحظتها فيها بشكل أكبر أو أقل. وبالتالي ، فإن تفضيل حدوث الأنواع في مواقع مختلفة أقرب إلى التوزيع الحقيقي للأنواع ، حيث إنها تمثل "المعلومات الكاملة" حول الوجود المحتمل للأنواع ، بشرط أن يكون النموذج قد نجح في التقاط الارتباطات ذات الصلة بتوزيع الأنواع.

يمكن اشتقاق الأفضلية إما من نموذج إحصائي أو ميكانيكي ، اعتمادًا على كيفية الحصول على قيم الاحتمالات. ومع ذلك ، إذا أخذنا في الاعتبار أنه في ميكانيكا الكم ، يمكن وصف الاحتمالات فقط كتوزيع إحصائي وفقط عندما تتكرر التجربة أو الملاحظة عدة مرات ، يصبح الفرق بين SDMs الميكانيكية والإحصائية غير واضح ، وقد تقترب النماذج الإحصائية من (الكم) النماذج الميكانيكية مع إعطاء أعداد كافية من الملاحظات.

ومع ذلك ، فإن بعض الاختلافات بين توزيعات الأنواع والوظائف الموجية الكمومية هي أيضًا براءة اختراع ، حيث تتكون الأنواع من العديد من الأفراد بينما الجسيم واحد ، والمجالات العيانية والمجهرية ، على التوالي ، للظواهر المعنية تجعلها مختلفة. بالإضافة إلى ذلك ، وعلى عكس وظائف الموجة ، تعتمد أفضلية الحدوث على الظروف البيئية المحددة وتاريخ الأنواع. هذا هو السبب في أن وظيفة التفضيل لا ينبغي أن تكون من النوع المطبق عادةً على الجسيمات دون الذرية الكمية ، ولكنها مرتبطة باحتمالية حدوث الأنواع ، وأكثر انسجامًا مع المفاهيم المستخدمة هي نمذجة توزيع الأنواع أو ، بشكل عام ، في الجغرافيا الحيوية.

ملاحظة: ظاهرة الكم في الكائنات الحية

لاحظ ، بشكل مهم ، أن الحجج السابقة لا تتطلب معاملة الكائنات الحية نفسها كأشياء كمومية بالفعل ، ولم يتم ملاحظة أي كائن حي لإثبات السلوك الكمي ككائن كامل (Romero-Isart et al. 2010 Bull and Gordon 2015 Li and Yin 2015 على الرغم من الاطلاع على Rodríguez et al. 2015b). ومع ذلك ، فإن الظواهر الكمية مهمة في مختلف العمليات البيولوجية والبيئية (Ball 2011) ، بما في ذلك التمثيل الضوئي (Engel et al. 2007 Mohseni et al. 2008 Sarovar et al. 2010) ، واستقبال مغناطيسي (Ahmad et al. 2007 Gegear et al. 2008 Keary et al. 2009 Gauger et al. 2011) ، سلوك الحيوان (Aerts et al. 2014 Holland 2014) ، الانتقاء الطبيعي (Lloyd 2009) ، البيئة والتطور (Rodríguez et al. 2015a، 2015b والمراجع الواردة فيه). وبالتالي ، فليس من المستغرب تمامًا أن تُفهم العلاقات واسعة النطاق بين توزيعات الأنواع والبيئة أيضًا في إطار مشابه لفيزياء الكم. على أي حال ، نحن هنا ندافع عن استخدام القياس الكمي كمفهوم إرشادي مع أدوات الكشف عن مجريات الأمور الناتجة (المعنى الثور 2015). نحن لا نقدم الأدوات الرياضية المتماثلة للتعامل مع ميكانيكا الكم مع توزيعات الأنواع ، ولكننا نقترح بدلاً من ذلك أن مثل هذا الإطار يمكن أن يطبق ويحسن الطريقة التي يتم بها بناء وتقييم SDM في العمل المستقبلي.


نتائج

توقعت نماذج المجموعات التي تم إنشاؤها سابقًا (Kessler et al. 2019) الأنواع الثلاثة التي احتلت نطاقات منخفضة إلى حد كبير من البر الرئيسي ، اعتمادًا على عدد SDMs المستخدمة لتحديد منطقة "مناسبة" (الجدول 1 الشكل 1). بشكل عام ، كانت أكبر المناطق المتجاورة ، التي تحظى بأكبر قدر من الإجماع ، في الجزء الشمالي الأوسط من الولاية. تنبأت نماذج أقل بحدوث الأنواع باتجاه الجنوب أو في المسلة (شمال غرب). وتجدر الإشارة إلى أن بعض SDMs تنبأت بمناطق بيئات مناسبة تمتد من بحيرة Okeechobee وعلى طول الحافة الجنوبية للبر الرئيسي ، لجميع الأنواع.

تم تحديد نسبة البر الرئيسى لفلوريدا على أنها مناسبة لثلاثة أنواع من القراد من قبل أي من SDMs ، أو نموذج واحد أو اثنين ، أو ثلاثة أو أربعة نماذج ، أو جميع SDMs الخمسة

فهرس أبجدي . Amblyomma americanum . . Ixodes scapularis . . المتغيرات ديرماسينتور . .
. ٪ مساحة (كم 2). ٪ العابرة. (رقم العابرة). ٪ مساحة (كم 2). ٪ العابرة. (رقم العابرة). ٪ مساحة (كم 2). ٪ العابرة. (رقم العابرة).
لا أحد 46.6 (68,388) 8.1 (75) 39.5 (57,968) 0.0 (51) 26.0 (38,156) 0.0 (35)
1–2 30.8 (45,200) 19.7 (81) 33.0 (48,428) 8.2 (110) 50.9 (74,698) 1.5 (135)
3–4 13.0 (19,078) 41.7 (36) 18.0 (26,416) 10.2 (39) 21.2 (31,112) 7.4 (54)
5 9.6 (14,088) 50.0 (58) 9.4 (13,795) 56.0 (50) 1.9 (2,788) 19.2 (26)
فهرس أبجدي . Amblyomma americanum . . Ixodes scapularis . . المتغيرات ديرماسينتور . .
. ٪ مساحة (كم 2). ٪ العابرة. (رقم العابرة). ٪ مساحة (كم 2). ٪ العابرة. (رقم العابرة). ٪ مساحة (كم 2). ٪ العابرة. (رقم العابرة).
لا أحد 46.6 (68,388) 8.1 (75) 39.5 (57,968) 0.0 (51) 26.0 (38,156) 0.0 (35)
1–2 30.8 (45,200) 19.7 (81) 33.0 (48,428) 8.2 (110) 50.9 (74,698) 1.5 (135)
3–4 13.0 (19,078) 41.7 (36) 18.0 (26,416) 10.2 (39) 21.2 (31,112) 7.4 (54)
5 9.6 (14,088) 50.0 (58) 9.4 (13,795) 56.0 (50) 1.9 (2,788) 19.2 (26)

على سبيل المثال ، تم اعتبار 9.4 ٪ من الدولة مناسبًا I. كتفي من خلال جميع الموديلات الخمسة وهذا يغطي مساحة 13.795 كم 2. ستة وخمسون في المئة من 50 مقطعا في هذه المنطقة أسفرت I. كتفي. تم توقع أجزاء كبيرة ، ولكن متفاوتة ، من الحالة غير مناسبة لكل نوع (التوافق = لا شيء). قدرت مساحة اليابسة في البر الرئيسي لفلوريدا بـ 146،754.6 كيلومتر مربع (كيسلر وآخرون 2019). SDM ، نموذج توزيع الأنواع العابرة ، المقطع العرضي.

تم تحديد نسبة البر الرئيسى لفلوريدا على أنها مناسبة لثلاثة أنواع من القراد من قبل أي من SDMs ، أو نموذج واحد أو اثنين ، أو ثلاثة أو أربعة نماذج ، أو جميع SDMs الخمسة

فهرس أبجدي . Amblyomma americanum . . Ixodes scapularis . . المتغيرات ديرماسينتور . .
. ٪ مساحة (كم 2). ٪ العابرة. (رقم العابرة). ٪ مساحة (كم 2). ٪ العابرة. (رقم العابرة). ٪ مساحة (كم 2). ٪ العابرة. (رقم العابرة).
لا أحد 46.6 (68,388) 8.1 (75) 39.5 (57,968) 0.0 (51) 26.0 (38,156) 0.0 (35)
1–2 30.8 (45,200) 19.7 (81) 33.0 (48,428) 8.2 (110) 50.9 (74,698) 1.5 (135)
3–4 13.0 (19,078) 41.7 (36) 18.0 (26,416) 10.2 (39) 21.2 (31,112) 7.4 (54)
5 9.6 (14,088) 50.0 (58) 9.4 (13,795) 56.0 (50) 1.9 (2,788) 19.2 (26)
فهرس أبجدي . Amblyomma americanum . . Ixodes scapularis . . المتغيرات ديرماسينتور . .
. ٪ مساحة (كم 2). ٪ العابرة. (رقم العابرة). ٪ مساحة (كم 2). ٪ العابرة. (رقم العابرة). ٪ مساحة (كم 2). ٪ العابرة. (رقم العابرة).
لا أحد 46.6 (68,388) 8.1 (75) 39.5 (57,968) 0.0 (51) 26.0 (38,156) 0.0 (35)
1–2 30.8 (45,200) 19.7 (81) 33.0 (48,428) 8.2 (110) 50.9 (74,698) 1.5 (135)
3–4 13.0 (19,078) 41.7 (36) 18.0 (26,416) 10.2 (39) 21.2 (31,112) 7.4 (54)
5 9.6 (14,088) 50.0 (58) 9.4 (13,795) 56.0 (50) 1.9 (2,788) 19.2 (26)

على سبيل المثال ، تم اعتبار 9.4 ٪ من الدولة مناسبًا I. كتفي من خلال جميع الموديلات الخمسة وهذا يغطي مساحة 13.795 كم 2. ستة وخمسون في المئة من 50 مقطعا في هذه المنطقة أسفرت I. كتفي. تم توقع أجزاء كبيرة ، ولكن متفاوتة ، من الحالة غير مناسبة لكل نوع (التوافق = لا شيء). قدرت مساحة اليابسة في البر الرئيسي لفلوريدا بـ 146،754.6 كيلومتر مربع (كيسلر وآخرون 2019). SDM ، نموذج توزيع الأنواع العابرة ، المقطع العرضي.

(أ) توقع نموذج المجموعة لـ Amblyomma americanum ومواقع أخذ العينات لـ 41 موقعًا في الدراسة الأصلية (الصناديق المفتوحة والمثلثات الممتلئة) المستخدمة لإنشاء نماذج توزيع مجموعات الأنواع (SDMs) (Kessler et al. 2019). مخطط الألوان لاتفاق النموذج هو من Kessler et al. (2019) ، مع اللون الرمادي = لا توجد نماذج متوقعة حدوثها من خلال اللون الأخضر (نموذج أو نموذجان) ، أصفر (توافق ثلاثة نماذج) ، برتقالي (توافق أربعة نماذج) ، أو أحمر (جميع النماذج تتنبأ بحدوثها). تم مسح المثلثات الممتلئة أثناء المسح الأصلي وأثناء التحقق من الصحة. تشير المربعات المعبأة إلى مواقع مسح جديدة للتحقق من الصحة. تُظهر الأشكال الداخلية في (أ) مثالاً على مقطع عرضي في الموقع مع وجود خطأ حذف (تم العثور على المقطع العرضي "علامة إيجابية" لـ A. americanum، ولكن لم يكن هناك نموذج تجميع متوقع حدوث [الاتفاقية = 0]) ، ومثال لخطأ العمولة (مقطع دائرة مفتوحة حيث يتم تنفيذ المهمة A. americanum لم يتم العثور عليها ولكن نموذج المجموعة توقع حدوث "اتفاقية & gt 0"). (ب) توقع نموذج المجموعة ل Ixodes scapularis مع نفس المواقع الأصلية والتحقق من الصحة. نظام الألوان كما في (أ). يوضح Inset مثالاً لموقع به مقطع عرضي لـ "خطأ عمولة" ، ولم يتم العثور على أخطاء في الإغفال I. كتفي. (ج) توقع نموذج المجموعة لـ المتغيرات ديرماسينتور. نظام الألوان كما في (أ). يوضح الشكل الداخلي مثالاً لموقع به عرض لخطأ عمولة ، ولم يتم العثور على أخطاء في الإغفال المتغيرات D..

(أ) توقع نموذج المجموعة لـ Amblyomma americanum ومواقع أخذ العينات لـ 41 موقعًا في الدراسة الأصلية (الصناديق المفتوحة والمثلثات الممتلئة) المستخدمة لإنشاء نماذج توزيع مجموعات الأنواع (SDMs) (Kessler et al. 2019). مخطط الألوان لاتفاق النموذج هو من Kessler et al. (2019) ، باللون الرمادي = لا توجد نماذج متوقعة حدوثها من خلال اللون الأخضر (نموذج واحد أو نموذجان) ، الأصفر (توافق ثلاثة نماذج) ، البرتقالي (توافق أربعة نماذج) ، أو الأحمر (كل النماذج تتنبأ بحدوثها) تم مسح المثلثات الممتلئة أثناء المسح الأصلي وأثناء التحقق من الصحة. تشير المربعات المعبأة إلى مواقع مسح جديدة للتحقق من الصحة. تُظهر الأشكال الداخلية في (أ) مثالاً على مقطع عرضي في الموقع مع وجود خطأ حذف (تم العثور على المقطع العرضي "علامة إيجابية" لـ A. americanum، ولكن لم يكن هناك نموذج مجموعة متنبأ بحدوث [الاتفاقية = 0]) ، ومثال على خطأ العمولة (مقطع دائرة مفتوحة حيث تكون المهمة A. americanum لم يتم العثور عليها ولكن نموذج المجموعة توقع حدوث "اتفاقية & gt 0"). (ب) توقع نموذج المجموعة ل Ixodes scapularis مع نفس المواقع الأصلية والتحقق من الصحة. نظام الألوان كما في (أ). يوضح Inset مثالاً لموقع به مقطع عرضي لـ "خطأ عمولة" ، ولم يتم العثور على أخطاء في الإغفال I. كتفي. (ج) توقع نموذج المجموعة لـ المتغيرات ديرماسينتور. نظام الألوان كما في (أ). يوضح الشكل الداخلي مثالاً لموقع به عرض لخطأ عمولة ، ولم يتم العثور على أخطاء في الإغفال المتغيرات D..

تم توزيع مواقع مسح التحقق على نطاق واسع في جميع أنحاء البر الرئيسي ، بما في ذلك المناطق التي تنبأت فيها نماذج المجموعات بغياب الأنواع (الشكل 1). في عام 2019 ، تضمنت مواقع التحقق البالغ عددها 43 موقعًا 250 مقطعًا تم مسحها 1450 مرة وفقًا لجدول نصف شهري تقريبًا ، على الرغم من اختلاف ذلك باختلاف الظروف المحلية. تراوحت أعداد المقاطع من 2 إلى 17 في كل موقع (الوسيط = 4 قطاعات) بناءً على حجم الموقع وفئات الغطاء الأرضي الحالية (Glass et al. 2019). تم أخذ عينات من ثمانية عشر موقعًا و 105 مقاطع خلال تطوير نموذج المجموعة (2015-2018) وتم إعادة أخذ عينات منها للتحقق من صحتها. تم مسح خمسة وعشرين موقعًا ، مع 145 مقطعًا عرضيًا لأول مرة خلال عام 2019 (الشكل 1 ، الجدول 1 الملحق 1 [عبر الإنترنت فقط]).

كان متوسط ​​طول المقاطع 156 م ± 2.5 م (x ± SE) ، والتي لم تكن مختلفة بشكل كبير عن أطوال المقطع العرضي 2015 إلى 2018. لم تختلف مقاطع التحقق من الصحة حيث تم جمع القراد اختلافًا كبيرًا في الطول عن مقاطع التحقق حيث لم يتم جمع القراد (نسبة الأرجحية = 0.99 95 ٪ فاصل الثقة = 0.98-1.01).

كانت المقاطع التي تم فيها جمع القراد في استطلاعات التحقق من الصحة متوافقة مع تلك من 2015 إلى 2018 (ملحق الجدول 1 [عبر الإنترنت فقط]). من بين 18 موقعًا تم إعادة أخذ عينات منها ، اتفق 64.8٪ (35/54 ، حيث يكون المقام 18 موقعًا × 3 أنواعًا) بين تطوير النموذج (2015-2018) والتحقق (أنواع القراد إما موجودة أو غائبة). من بين المواقع المتضاربة ، أسفر 29.6٪ (16/54) عن أنواع القراد أثناء تطوير النموذج ولكن ليس أثناء التحقق من الصحة. كانت هذه المواقع حيث نادرًا ما لوحظ أحد الأنواع خلال 2015-2018 (سجل مقطع واحد أو اثنان فقط جدول ملحق 1 "موجود" [عبر الإنترنت فقط]). على سبيل المثال، A. americanum تم العثور عليه مرة واحدة في مقطع عرضي واحد في كولت كريك خلال 2015-2018 (1/13 مقطعًا خلال 158 مسحًا) ولم يتم العثور عليه في أي مقاطع خلال عام 2019 (ملحق الجدول 1 [عبر الإنترنت فقط]). المتغيرات ديرماسينتور، والتي تم التقاطها بشكل متقطع خلال الدراسات ولدت معظم نتائج المسح المتضاربة (7/18 موقعًا). نادرًا ما لوحظ أحد الأنواع لأول مرة في موقع ما أثناء التحقق من الصحة عندما لم يتم اكتشافه أثناء تطوير النموذج. كانت هناك ثلاثة مواقع (واحد لكل نوع) حيث تم جمع الأنواع لأول مرة في عام 2019 وتم العثور عليها فقط في مقاطع عرضية واحدة. تقع هذه المقاطع الثلاثة ضمن مناطق التكرار المتوقعة لنماذج المجموعة.

بشكل عام ، نسبة المقاطع التي تنتج بالغين المتغيرات D., I. كتفي، أو A. americanum تراوحت من 4.0 إلى 26.4٪ (الجدول 2). تم أخذ عينات من قراد النجمة الوحيدة بشكل متكرر (60/250 مقطعًا جانبيًا) ، في حين أن القراد ذو الأرجل السوداء أقل شيوعًا إلى حد ما (41/250 مقطعًا) وقراد الكلاب كان أقل توثيقًا في كثير من الأحيان (10/250 مقطعًا مقطعيًا الجدول 2). على الرغم من التباين الواسع في المقاطع التي تسفر عن أنواع مختلفة ، كانت جميع الأنواع منتشرة جغرافياً (ملحق الجدول 1 [عبر الإنترنت فقط]).

مقارنة استطلاعات التحقق من الصحة (الأعمدة المقاطع الإيجابية / السلبية) مع تنبؤات SDM في المقطع العرضي (يشير نموذج الصفوف إلى حاضر / غائب) ومقاييس موجزة للتقييم (± 95٪ CI)

نموذج . Amblyomma americanum . . . Ixodes scapularis . . . المتغيرات ديرماسينتور . . .
. إيجابي . نفي . مجموع . إيجابي . نفي . مجموع . إيجابي . نفي . مجموع .
الحالي 60 116 176 41 158 199 10 204 214
غائب 6 68 74 0 51 51 0 36 36
مجموع 66 184 250 41 209 250 10 240 250
يقيس
حساسية 90.9 (81.3, 96.6) 100.0 (91.4, 100.0) 100.0 (69.2, 100.0)
النوعية 37.0 (30.0, 44.4) 24.4 (18.7, 30.8) 15.0 (10.7, 20.2)
PPV 34.1 (31.1, 37.2) 20.6 (19.4, 21.9) 4.7 (4.4, 4.9)
صافي القيمة الحالية 91.9 (83.8, 96.1) 100.0 100.0
نموذج . Amblyomma americanum . . . Ixodes scapularis . . . المتغيرات ديرماسينتور . . .
. إيجابي . نفي . مجموع . إيجابي . نفي . مجموع . إيجابي . نفي . مجموع .
الحالي 60 116 176 41 158 199 10 204 214
غائب 6 68 74 0 51 51 0 36 36
مجموع 66 184 250 41 209 250 10 240 250
يقيس
حساسية 90.9 (81.3, 96.6) 100.0 (91.4, 100.0) 100.0 (69.2, 100.0)
النوعية 37.0 (30.0, 44.4) 24.4 (18.7, 30.8) 15.0 (10.7, 20.2)
PPV 34.1 (31.1, 37.2) 20.6 (19.4, 21.9) 4.7 (4.4, 4.9)
صافي القيمة الحالية 91.9 (83.8, 96.1) 100.0 100.0

CI ، فاصل الثقة PPV ، القيمة التنبؤية الإيجابية NPV ، القيمة التنبؤية السلبية SDM ، نموذج توزيع الأنواع.

مقارنة استطلاعات التحقق من الصحة (الأعمدة المقاطع الإيجابية / السلبية) مع تنبؤات SDM في المقطع العرضي (يشير نموذج الصفوف إلى حاضر / غائب) ومقاييس موجزة للتقييم (± 95٪ CI)

نموذج . Amblyomma americanum . . . Ixodes scapularis . . . المتغيرات ديرماسينتور . . .
. إيجابي . نفي . مجموع . إيجابي . نفي . مجموع . إيجابي . نفي . مجموع .
الحالي 60 116 176 41 158 199 10 204 214
غائب 6 68 74 0 51 51 0 36 36
مجموع 66 184 250 41 209 250 10 240 250
يقيس
حساسية 90.9 (81.3, 96.6) 100.0 (91.4, 100.0) 100.0 (69.2, 100.0)
النوعية 37.0 (30.0, 44.4) 24.4 (18.7, 30.8) 15.0 (10.7, 20.2)
PPV 34.1 (31.1, 37.2) 20.6 (19.4, 21.9) 4.7 (4.4, 4.9)
صافي القيمة الحالية 91.9 (83.8, 96.1) 100.0 100.0
نموذج . Amblyomma americanum . . . Ixodes scapularis . . . المتغيرات ديرماسينتور . . .
. إيجابي . نفي . مجموع . إيجابي . نفي . مجموع . إيجابي . نفي . مجموع .
الحالي 60 116 176 41 158 199 10 204 214
غائب 6 68 74 0 51 51 0 36 36
مجموع 66 184 250 41 209 250 10 240 250
يقيس
حساسية 90.9 (81.3, 96.6) 100.0 (91.4, 100.0) 100.0 (69.2, 100.0)
النوعية 37.0 (30.0, 44.4) 24.4 (18.7, 30.8) 15.0 (10.7, 20.2)
PPV 34.1 (31.1, 37.2) 20.6 (19.4, 21.9) 4.7 (4.4, 4.9)
صافي القيمة الحالية 91.9 (83.8, 96.1) 100.0 100.0

CI ، فاصل الثقة PPV ، القيمة التنبؤية الإيجابية NPV ، القيمة التنبؤية السلبية SDM ، نموذج توزيع الأنواع.

عندما تم تقسيم نماذج المجموعات (Kessler et al. 2019) (لم يكن هناك توقع بحدوث SDM مقابل حدوث SDM واحد على الأقل في المقطع العرضي) ، كانت NPV (نماذج المجموعة التي تستبعد المقاطع على أنها تنتج القراد البالغ) عالية باستمرار (الجدول 2) . صافي القيمة الحالية كان 100.0٪ لـ I. كتفي و المتغيرات D. قيمة NPV لـ A. americanum كانت عالية أيضًا (91.9 ٪) ، ولكن تم العثور على قراد نجم وحيد بالغ في ستة مقاطع لم يكن من المتوقع حدوثها. وبالمثل ، كانت الحساسية عالية ، بحيث تم العثور على القراد بشكل حصري تقريبًا في المقاطع التي تنبأت بها SDMs (الجدول 2).

على النقيض من ذلك ، فإن العديد من المقاطع التي تنبأت بها SDMs يجب أن تسفر عن علامات لم (أخطاء العمولة) تنتج تقديرات عامة منخفضة لـ PPV والنوعية (الجدول 2). يبدو أن هذا كان مدفوعًا في الغالب بتنبؤات أقلية من SDMs. من 30.8 إلى 50.9 ٪ من الولاية لديها علامات مهمة للبالغين بناءً على واحد أو اثنين فقط من SDMs. تحسنت القيم التنبؤية المنخفضة بشكل عام مع زيادة الاتفاق بين SDMs ، بحيث عندما توقعت غلبة SDM (نماذج 3 أو 4 أو 5) حدوثها ، كانت المقاطع التي تنتج علامات التجزئة أعلى (الشكل 2). حدث التوافق في 23-27٪ من البر الرئيسي (الجدول 1) ومن المفترض أنه يمثل أعلى احتمالية للتعرض للقراد المطلوب (كيسلر وآخرون 2019).

نسبة مقاطع التحقق من الصحة التي أسفرت عن أنواع القراد البالغة مع زيادة اتفاقية نموذج توزيع الأنواع (SDM). كانت المقاطع التي تحتوي على 0 توافق قد توقعت جميع SDMs أن أنواع القراد ستكون غائبة. كانت المقاطع ذات الخمسة توافق قد تنبأت جميع SDMs بوجود أنواع محددة من القراد. المحور الرأسي هو النسبة المئوية للمقاطع في فئات التوافق (الجدول 1) التي أسفرت عن أنواع معينة من القراد.

نسبة مقاطع التحقق من الصحة التي أسفرت عن أنواع القراد البالغة مع زيادة اتفاقية نموذج توزيع الأنواع (SDM). كانت المقاطع التي تحتوي على 0 توافق قد توقعت جميع SDMs أن أنواع القراد ستكون غائبة. كانت المقاطع ذات الخمسة توافق قد تنبأت جميع SDMs بوجود أنواع محددة من القراد. المحور الرأسي هو النسبة المئوية للمقاطع في فئات التوافق (الجدول 1) التي أسفرت عن أنواع معينة من القراد.

المقاطع 6/74 التي لم تتوقعها النماذج A. americanum كانت مقاطع خطأ الإغفال (الجدول 2). كانت هذه المقاطع بالقرب من المكان الذي تنبأت فيه SDM بحدوثها (الشكل 1 أ ، داخلي على سبيل المثال). كانت جميع المقاطع الستة ضمن نصف كيلومتر من الموطن المناسب وكان نصفها في نطاق 300 متر (= 3 بكسل). والجدير بالذكر أن مقاطع "خطأ الإغفال" هذه كانت على شكل أرضي معين في شمال وغرب فلوريدا الساحلية. كانت هذه المقاطع فوق عربات الترام التجارية المهجورة في المستنقعات التي كانت تستخدم لحصاد السرو.


الفصل السابع ـ التشابه البيئي

يستعرض الفصل المقاييس الرئيسية للارتباط بين الكائنات أو الواصفات المستخدمة في علم البيئة لتجميع الكائنات أو الواصفات ، أو إنتاج مخططات تنسيق في مساحات ذات أبعاد منخفضة. يتضمن الفصل مناقشة الموضوعات التالية: تحليلات Q و R (مربع بيانات ثلاثي الأبعاد ، O-mode للتحليل ، P-mode للتحليل ، Q-mode للتحليل ، R-mode للتحليل ، S-mode للتحليل ، T - طريقة التحليل ، والاختيار بين وضع Q و R ، والفضاء A ، والمساحة المترية أو الإقليدية) ، ومعاملات الارتباط (معاملات التشابه ، ومعاملات المسافة ، ومعاملات التبعية ، ومشكلة الصفر المزدوج ، والمعامل غير المتماثل ، والمعامل المتماثل) ، ومعاملات التشابه في وضع Q (معاملات التشابه الثنائي المتماثل ، معاملات التشابه الثنائي غير المتماثل ، معاملات التشابه الكمي المتماثل ، القيم المفقودة ، مصفوفة التشابه الجزئي ، معاملات التشابه الكمي غير المتماثلة ، معاملات التشابه الاحتمالية) ، معاملات المسافة في الوضع Q (الخصائص المترية ، معاملات التباين والمسافة ، القياس المعامِلات ، ومعاملات المسافة النصفية) ، ومعاملات الاعتماد في الوضع R (معاملات الاعتماد لـ الواصفات بخلاف وفرة الأنواع ، ومعاملات الاعتماد على وفرة الأنواع ، والجمعيات البيولوجية) ، واختيار المعامل (المعايير ، وسلسلة حالات المقارنة المرتبة) ، والتحولات لبيانات تكوين المجتمع (صيغ التحويل ، وتحويل الوتر ، وتحويل ملف تعريف الأنواع ، Hellinger التحول ، تحويل مسافة كاي ، تحويل متري مربع كاي ، تجانس بيلز). يتم توضيح الطرق العددية من خلال تطبيقات بيئية حقيقية مستمدة من الأدبيات. ينتهي الفصل بوصف البرامج ذات الصلة المطبقة بلغة R كما يستشهد ببعض الحزم والبرامج الإحصائية المتاحة تجارياً من الباحثين.


توقع توزيعات الكائنات البحرية على النطاق العالمي

نحن نقدم برنامج AquaMaps ونقيمه ، وهو نظام نمذجة لتوزيع الأنواع يقتصر على الحضور فقط ويسمح بدمج معرفة الخبراء حول استخدام الموائل وقد تم تصميمه لتحقيق أقصى قدر من إنتاج خرائط نطاق الأنواع الموحدة على النطاق العالمي. في البيئة البحرية ، هناك تحد كبير أمام إنتاج خرائط النطاق بسبب التحيزات الكبيرة في كمية وموقع بيانات التواجد لمعظم الأنواع. تتم مقارنة AquaMaps مع طرق نمذجة توزيع الأنواع التقليدية للتواجد فقط لتحديد جودة المخرجات في ظل ظروف مؤتمتة مكافئة. يتم أيضًا التحقيق في تأثير إدراج معرفة الخبراء في AquaMaps. تم اختبار مخرجات النموذج داخليًا ، من خلال تقسيم البيانات ، وخارجيًا مقابل بيانات المسح المستقلة لتحديد قدرة النماذج على التنبؤ بالوجود مقابل الغياب. تم اختبار النماذج أيضًا خارجيًا من خلال تقييم الارتباط مع تقديرات المسح المستقلة لوفرة الأنواع النسبية. تقارن مخرجات AquaMaps جيدًا بالطرق الحالية التي تم اختبارها ، وإدراج نتائج معرفة الخبراء في تحسين عام في مخرجات النموذج. يتم اقتراح الشفافية والسرعة والقدرة على التكيف لنظام AquaMaps ، بالإضافة إلى إطار العمل الحالي عبر الإنترنت الذي يسمح بمراجعة الخبراء للتعويض عن تحيزات أخذ العينات وبالتالي تحسين تنبؤات النموذج كمزايا إضافية للاستخدام العام والبحث على حد سواء.


استنتاج

وجود وموائل مناسبة محتملة لـ C. تشينينسيس تم تقييمها والتنبؤ بها باستخدام أفضل نماذج Maxent التي تم تقييمها بواسطة كل من مؤشر AUC ومؤشر TSS. تم اختيار ستة متغيرات بيولوجية مناخية رئيسية تؤثر على توزيع الأنواع من إجمالي 19 متغيرًا مناخيًا حيويًا.هذه هي المتوسط ​​السنوي لدرجات الحرارة ، متساوي الحرارة ، موسمية درجات الحرارة ، موسمية هطول الأمطار ، هطول الأمطار في الربع الأكثر دفئًا ، وهطول الأمطار في الربع الأبرد. التحكم في درجة الحرارة والتهطال يمكن أن يمنع ويحمي C. تشينينسيس. الموطن المناسب لـ C. تشينينسيس يتم توزيعها بشكل رئيسي في الصين. مقارنة بتوزيعها الحالي ، قدمت فترة الهولوسين الأوسط مساحة أكبر مناسبة مناخيا C. تشينينسيس، وكان وسط وجنوب الصين مناسبين بشكل خاص. نتائج المحاكاة C. تشينينسيس أشارت ملاءمة الموائل في RCP2.6 و RCP8.5 إلى أن C. تشينينسيس انخفضت ملاءمة الموائل بسبب ارتفاع درجة حرارة المناخ. يشير هذا إلى اتجاه تنازلي لـ C. تشينينسيس التوزيع في المستقبل. بالإضافة إلى المتغيرات المناخية الحيوية المذكورة أعلاه ، قد تؤثر عوامل أخرى أيضًا على الموطن المناسب للنباتات ، مثل التربة والحواجز الجغرافية والاضطراب البشري وتوزيع العوائل [41 ، 42]. على الرغم من أن هذه الدراسة نظرت فقط في تأثير المناخ على C. تشينينسيس، إذا كانت تأثيرات الأنشطة البشرية ، والحواجز الجغرافية ، وظروف التربة على الغطاء النباتي ، وتوزيع العائل يجب أن تؤخذ في الاعتبار بشكل شامل ، فإن توزيع C. تشينينسيس يمكن توقعها بدقة أكبر. ومع ذلك ، فإن الخلل يؤثر على دقة ENMs ، والتي تتوقف بشكل حاسم على جودة بيانات الحدوث وغالبًا ما تستخدم البيانات التي تم جمعها عشوائيًا. على الرغم من تعيين الحد الأقصى لعدد نقاط الخلفية إلى 10000 ، لمطابقة انحياز المخزن المؤقت لسجلات المظهر ، فإن سجلات الخلفية المستخدمة كانت مقيدة في آسيا.


مناقشة

تركز هذه الدراسة بشكل أساسي على تحليل نماذج الشبكة العصبية التلافيفية (CNN) للتنبؤ بتوزيع النبات. للتأكد من أن هذا التحليل مهم ، نقوم أولاً بالتحقق من صحة نموذجنا مقابل النماذج الأخرى الأكثر استخدامًا مثل Boosted Trees (BT) و Random Forest (RF). نقارن أيضًا CNN بشبكة عصبية عميقة غير تلافيفية مماثلة (DNN). المقياس الرئيسي المقترح هو المتوسط دقة أعلى k لكل الأنواع. تم تكييف هذا المقياس مع مجموعة البيانات الخاصة بنا التي تكون موجودة فقط ، وعلى نطاق واسع (مساحة كبيرة والعديد من الأنواع) وغير متوازن إلى حد كبير بين الأنواع وفقًا لتوزيع طويل الذيل. نحن نقدم أيضًا تقييم CNN وأفضل نموذج منطقي ، RF ، على المقاييس المعتادة ، AUC و TSS. تتمثل القيود الرئيسية لهذه المقاييس في (1) التحيز الناجم عن توليد بيانات الغياب الزائف و (2) عدم ملاءمة التقييم للأنواع ذات الحدوث الأقل ، لا سيما تلك التي تحدث مرة واحدة أو اثنتين فقط. كانت نتائج CNN و RF قريبة باستخدام هذه المقاييس. على وجه الخصوص ، حققت CNN و RF درجات مماثلة لمتوسط ​​AUC على جميع الأنواع. كشف مخطط الصندوق الخاص بقيم AUC حسب الأنواع أن CNN أفضل بالفعل لمعظم الأنواع ولكن القيم المتطرفة تميل إلى تدهور القيمة المتوسطة. تسلط هذه النتائج الضوء على أن المقاييس المعتادة لـ SDM (AUC ، TSS ، إلخ) ليست بالضرورة هي الأنسب لنوع النموذج الذي ندرسه. يمكن أن يؤثر اختيار الغياب الزائف بشكل مصطنع على درجة النماذج. في سياقنا هذا الاختيار صعب بشكل خاص ، جهد أخذ العينات غير منتظم بشكل كبير من الناحية المكانية ويؤدي توزيع الذيل الطويل إلى عدد قليل جدًا من الملاحظات للعديد من الأنواع. يتم اختيارنا للغياب الزائف من أجل تقليل التحيز قدر الإمكان ولكن لا يزال من الصعب تقييم التحيز المتبقي. على وجه الخصوص ، يمكن أن يؤثر اختيار حدوث الأنواع الأخرى على أنها غيابات زائفة أكثر على الأنواع ذات التوزيعات الكبيرة أو الأنواع الموجودة في الموائل ذات الثراء العالي للأنواع. في سياق النماذج متعددة الأنواع ، قد تعاقب هذه التقييمات نموذجًا تكمن قوته في تحديد مجموعات متماسكة من الأنواع. بالإضافة إلى ذلك ، تم تصميم نماذجنا لبيانات الحضور فقط وتم تحسينها للتنبؤ بالاحتمالات الشرطية الفئوية وليس احتمالات التواجد. يمكن تكييف هذا بسهولة مع CNN نظرًا لعمله الذي ينتج نموذجًا خطيًا فرديًا لكل نوع في الطبقة الأخيرة من الشبكة. تسمح هذه الطبقة من السجلات بعد ذلك بالتنبؤ لكل نوع يعتمد على الأنواع الأخرى على مستوى العالم (من خلال التعلم متعدد الأنواع) ولكنه لا يعتمد بشكل مباشر على تنبؤ الأنواع الأخرى في نقطة مكانية معينة. هذا غير ممكن بالنسبة لنموذج التردد الراديوي الذي يعد مصنفًا والذي يقوم بإرجاع الاحتمالات النسبية مباشرة. للحد من هذا التأثير ، من الممكن استخدام القياس لإرجاع القيم المتوقعة بين 0 و 1 لكل نوع ولكن القيم التي تم الحصول عليها تظل معتمدة على قيم الأنواع الأخرى. لكل هذه الأسباب نختار بعد ذلك استخدام المتوسط دقة أعلى k لكل نوع كمقياس التقييم الرئيسي لنوع النماذج المدروسة. هذا المقياس له ميزتان رئيسيتان: (1) أنه غير متحيز بالتوزيع المكاني لجهد المراقبة (لأنه يعتمد على احتمالية الأنواع المشروط بملاحظة) و (2) ، يسمح بتقييم قدرة النموذج على توقع مجموعات متماسكة من الأنواع بشكل مشترك. نعتقد أن هذا المقياس ليس مثاليًا أيضًا لأن حجم مجموعة الأنواع التي يمكن ملاحظتها في موقع معين يمكن أن يكون متغيرًا. لذلك ، في العمل المستقبلي ، نخطط للعمل على نسخة أكثر تكيفًا من تقييم تنبؤ المجموعات (كما تمت دراسته على سبيل المثال في [43]).

أكدت تجاربنا أولاً النتائج السابقة للأدبيات التي تفيد بأن CNN-SDMs تؤدي أداءً أفضل من أحدث الأساليب مثل الأشجار المعززة أو الغابة العشوائية ، ولكن أيضًا من الشبكات العصبية العميقة التي تستخدم المعلومات البيئية الدقيقة (DNN-SDMs). استندت DNN-SDMs إلى نفس الهندسة المعمارية من CNN-SDMs ، لكنها كانت عمياء عن الجوار البيئي في المناظر الطبيعية المحيطة بنقاط حدوث. لذلك ، فإن الجوار البيئي أكثر من البيئة الدقيقة مهم للتنبؤ. يكون الأداء أكبر بشكل خاص للأنواع النادرة في مجموعة البيانات ، بينما كانت CNN-SDMs أقل كفاءة من الأشجار المعززة والغابات العشوائية للأنواع الأكثر تكرارًا. هذه النتيجة المركزية ذات أهمية نظرية وعملية ، لأن الأنواع النادرة (غالبًا ذات التوزيعات الجغرافية الضيقة ومتطلبات الموائل المتخصصة [44]) أكثر عددًا ، ومن المعروف أنها أكثر صعوبة في التنبؤ بها ، وهي مهمة للحفظ والإدارة. هناك نقاش طويل حول الطريقة التي ينشأ بها الارتباط الذاتي المكاني في توزيع الأنواع من كل من البنية البيئية وديناميات الأنواع [45 ، 46] ، وحول كيفية الاعتراف بالفضاء في تحليل أنماط التنوع البيولوجي [47]. يعتمد CNN-SDM على الموترات البيئية ، والتي لا تمثل فقط الظروف البيئية الدقيقة للمواقع التي تم أخذ عينات منها ، ولكن أيضًا الظروف البيئية المحيطة وهيكليتها المكانية. لفهم المعلومات الموجودة في البيئة المحيطة بشكل أفضل والتي تتيح تحقيق مكاسب في الأداء لـ CNN-SDM ، قمنا بتصميم معيار أصلي لـ CNN-SDMs البديلة بناءً على موترات محولة ، كل منها يتجاهل البنية المكانية على مستوى المناظر الطبيعية أو عدم التجانس في العوامل البيئية. سمحت مقارنة هذه CNN-SDMs بتحديد المعلومات الموجودة في الموترات التي حسنت القدرة التنبؤية. تفوقت CNN-SDM المحسوبة على الموترات غير المعدلة على جميع CNN-SDMs التي تم تعلمها على الموترات المحولة. على وجه الخصوص ، فإن CNN-SDM المحسوبة على الموترات غير المعدلة أفضل من CNN-SDMs التي تم تعلمها على موترات متغيرة أو متوسطة. تؤكد المقارنة أن ليس فقط متوسط ​​أو تباين البيئة في المناظر الطبيعية ، ولكن أيضًا هيكلها المكاني مهم. تم تأكيد هذه النتيجة من خلال النموذج الذي تم تعلمه على الموترات المعيارية (الهيكل) وهو أفضل من النماذج التي تم تعلمها على موترات متغيرة أو متوسطة توضح أن البنية المكانية متساوية ، إن لم تكن أكثر أهمية من قيمة البيئة للنموذج. وبالتالي ، فإن ملاءمة CNN-SDMs على الموترات الحقيقية يمكن أن تدرك التأثير على مستوى المناظر الطبيعية لكل من القيم المحلية البيئية والهيكلة المكانية. يمكن أن تحصل CNN-SDMs على قدرة تنبؤية كبيرة من خلال الاعتراف بالهيكل المكاني للبيئة حول المواقع ، أي. ، هيكل المناظر الطبيعية المحلية.

تدعم هذه النتائج دور العمليات البيئية على مستوى المناظر الطبيعية في تشكيل توزيعات الأنواع. على وجه التحديد ، يمكن أن يؤثر الهيكل المكاني لتجزئة الموائل [48] وكمية الموائل الملائمة [49] في المناظر الطبيعية على ثبات السكان في مواقع معينة [50]. إن القدرة التنبؤية الأفضل لـ CNN-SDMs تدعم بالفعل دور محركات نطاق المناظر الطبيعية في حدوث الأنواع. على سبيل المثال ، بالنسبة للتنبؤ الثنائي ، يمكن أن يمثل المتوسط ​​في المناظر الطبيعية كمية الموائل المتاحة ، في حين أن الهيكل المكاني للمناظر الطبيعية يمكن أن يعترف بدور الاتصال. يمكن أن يساعد استخدام تكوينات المناظر الطبيعية المختلفة في CNN في اختبار هذه الفرضيات البديلة والتأكيد على إمكانات نهج اختبار النظريات في البيئة المكانية.

فقط أداء النموذج على الصور المستديرة هو قريب من أداء CNN-SDM على أساس موترات بيئية حقيقية. ومع ذلك يمكننا ملاحظة اختلاف بين MSA1 و MSA40 حيث يكون النموذج الذي يحتوي على صورة مستديرة أسوأ. تفسيرنا هو أن الاتجاه على مستوى المناظر الطبيعية (على سبيل المثال. المنحدر الشمالي ضد. المنحدر الجنوبي) له تأثير على بعض الأنواع ولكنه ليس أهم المعلومات الهيكلية الواردة في الموترات.

تتضمن مخططات التصنيف التي تم إنشاؤها بواسطة مناهج التعلم الآلي الزخارف المتكررة لوقوع الأنواع والتأثيرات المشتركة للمتغير البيئي الأساسي. وبالتالي فإنه يسمح بمعالجة تواقيع العمليات البيئية على تجمعات الأنواع ، بما يتماشى مع الأساليب البديلة مثل jSDM [27]. يمكن أن تتضمن مناهج SDM التي تصنف أنواعًا متعددة قيودًا بيئية كلية وتقر بقواعد التشبع [51 ، 52]. بالإضافة إلى ذلك ، يجب أن تكون SDMs متعددة الأنواع أكثر قوة في مواجهة التحيزات في معلومات الحدوث [24]. نلاحظ أن المشكلة يتم تناولها هنا ، أي. التنبؤ بالاحتمالات النسبية للأنواع نظرًا لوجود حدث ، يختلف عن التنبؤ بكثافة الحدوث النسبية لكل نوع عبر الفضاء ، كما يحدث بواسطة MAXENT [9] وبشكل عام نماذج Poisson Point Processes [53]. شدة الحدوث المقدرة في الحالة الأخيرة حساسة لانحياز جهد الملاحظة [25] ، بينما في الحالة الأولى ، لا نهدف إلى توفير تقدير شدة مكانية. DNN و CNN هما نهجان قويان قادران على فهم التأثيرات المعقدة للمتغيرات البيئية على العديد من الأنواع. على الرغم من هذا التعقيد ، فقد أثبتت قواعد التنظيم نجاحها في اختيار المعلومات ذات الصلة والنماذج قليلة العدد بدرجة كافية. لذلك ، يجب أن تكون CNN-SDMs قادرة على فهم الأنماط البيئية والجغرافية الحيوية المشتركة بين العديد من الأنواع ، وبالتالي توفير تنبؤات قوية.

خرائط التنشيط للخلايا العصبية للطبقة الأخيرة ، أي. الميزات ، تسمح بتصور الأنماط البيئية التي تعلمتها CNN-SDM. وجدنا أن الخلايا العصبية كانت نشطة في مناطق كبيرة أو متعددة نسبيًا ، والتي يمكن أن تمثل توقيعات بيئية وكبيرة معقدة تتوافق مع الظروف البيئية المحلية أو على مستوى المناظر الطبيعية. بطبيعتها ، يمكن أن تجمع هذه الخلايا العصبية التكاملية بين العديد من المحركات البيئية وبالتالي تأثيرها المعقد والمشترك ، على سبيل المثال. من خلال عمليات التعويض. كانت بعض خرائط تنشيط الخلايا العصبية متوافقة مع الأنماط الجيومورفولوجية واسعة النطاق مثل سلاسل الجبال أو المناطق الساحلية. يمكن استخدام خرائط التنشيط لفحص كيف ينبثق الزخرفة البيئية الكلية الناشئة من ديناميكيات الأنواع والتنوع البيئي [54]. يُظهر إمكانات مناهج التعلم الآلي لكشف الأنماط الإيكولوجية الكلية واسعة النطاق من مجموعات بيانات الحدوث المكثف [55].

توضح دراستنا فائدة استخدام الشبكات العصبية التلافيفية لنمذجة توزيع الأنواع (CNN-SDMs). أولاً ، تسمح هندستها المعمارية بتعلم واصفات بيئية غير خطية للغاية. ثانيًا ، إنها فعالة بشكل خاص للتنبؤ بتوزيعات الأنواع النادرة. ثالثًا ، الميزة الرئيسية هي قدرة CNN على استخدام بيانات عالية الأبعاد مثل الموترات البيئية. في الواقع ، تُظهر دراستنا أن CNN-SDMs تلتقط معلومات عن هيكلة المناظر الطبيعية البيئية من خلال الموترات البيئية. هذه المعلومات أكثر ثراءً من البيئة المحددة بالمواعيد ولكنها غير متاحة للنماذج التقليدية.


شاهد الفيديو: #10:الترميز بكل انواعه واظهار الدوائر النسبية والاعمدة وغيرها على الخريطة Symbology in ArcGIS (شهر اكتوبر 2021).