# توزيع الحالات عشوائياً حسب بيانات التعداد

أرغب في وضع نقطة بشكل عشوائي داخل حدود جغرافية مع التحذير بأنني أرغب في استخدام بيانات التعداد بحيث يتم وضع النقاط عشوائيًا وفقًا للكثافة السكانية (أي أنه من المرجح أن يتم وضعها في الأماكن التي توجد بها كثافة سكانية أعلى). أود أن أفعل ذلك بشكل مثالي باستخدام لغة البرمجة R.

أنا لست شخصًا في نظم المعلومات الجغرافية ، لذلك لست متأكدًا تمامًا من كيفية القيام بذلك. لدي بعض بيانات التعداد ولدي إحداثيات الحدود الخاصة بي (كملف أشكال ، وهذا أعرف كيفية استخدامه) ، ولكن كيف يمكنني الجمع بين الاثنين وأكثر من ذلك ، ووضع نقطة بشكل عشوائي وفقًا لبيانات التعداد هو المكان الذي أكون فيه تعثر قليلا.

أنت في الواقع تسأل سؤالين. الأول هو كيفية دمج بيانات التعداد في ملف الشكل الخاص بك. هذا ليس صعبًا جدًا ، قد ترغب في تسجيل المغادرةدمجأوspCbind، أو هذه الإجابة. من الصعب القول دون معرفة بنية البيانات الخاصة بك.

السؤال الثاني حول كيفية القيام بأخذ العينات المرجحة. لدي اقتراح أدناه يستخدمspsampleمنصرزمة. إنه مثال فظ للغاية ، دون معرفة تفاصيل بياناتك.

مكتبة (sp) # اجعل بعض polys مع عدد السكان Sr1 = مضلع (cbind (c (2،4،4،1،2)، c (2،3،5،4،2))) Sr2 = مضلع (cbind ( c (5،4،2،5)، c (2،3،2،2))) Sr3 = مضلع (cbind (c (4،4،5،10،4)، c (5،3،2، 5،5))) Srs1 = المضلعات (قائمة (Sr1) ، "1") Srs2 = المضلعات (قائمة (Sr2) ، "2") Srs3 = المضلعات (قائمة (Sr3) ، "3") SpP = SpatialPolygons (قائمة (Srs1، Srs2، Srs3)، 1: 3) السكان <- data.frame (pop = c (30، 100، 250)، row.names = sapply (slot (SpP، "polygons")، function (x) slot (x، "ID"))) SpDF <- SpatialPolygonsDataFrame (SPP، Population) # تشكل بعض العينات ، ترتبط ارتباطًا مباشرًا بعينات الكثافة السكانية بحجم <- round (SpDF $pop / sapply (slot (SpDF، "polygons") ، وظيفة (x) الفتحة (x، "area"))) # sample s <- sapply (slot (SpDF، 'polygons')، الوظيفة (i) spsample (i، n = sampleize [as.integer (i @ ID)] ، اكتب = "عشوائي")) مؤامرة (SpDF) ؛ قطعة الأرض (مدمجة ، إضافة = T ، pch = 20 ، عمود = "أحمر") تم تطوير Biomapper في عام 2002 من قبل Alexandre Hirzel وزملاؤه في جامعة Lausanne ، سويسرا ، ويوفر نهجًا متعدد المتغيرات لنمذجة التوزيع الجغرافي للأنواع بناءً على بيانات الوجود فقط (Hirzel et al.2002). Biomapper هو برنامج متاح مجانًا. باستخدام المتغيرات البيئية (مثل المناخ والغطاء الأرضي والتضاريس) ومواقع GPS لوجود الأنواع ، يستخدم هذا البرنامج تحليل العوامل لمقارنة المواقع التي تم اكتشاف الأنواع فيها بمنطقة الدراسة بأكملها. من الناحية النظرية ، تتوافق نماذج تحليل عامل المكانة البيئية (ENFA) مع المفهوم المتخصص (Hutchinson 1959) ، مع المكانة الموصوفة بالحجم المفرط & ldquoa في مساحة متعددة الأبعاد للمتغيرات البيئية التي يمكن للأنواع من خلالها الحفاظ على مجموعة قابلة للحياة & rdquo. #### المبادئ والنهج ENFA لا تتطلب بيانات عن غياب الأنواع. غالبًا ما تكون بيانات غياب الأنواع غير موثوقة لأن الأنواع قد لا يتم اكتشافها حتى في حالة وجودها ، وقد تكون الأنواع غائبة على الرغم من أن الموائل مناسبة والبيانات ذات نماذج التحيز الخاطئة أو الغائبة الزائفة لملاءمة الموائل. التهميش والتخصص والمكانة البيئية من المتوقع أن تقع نقاط بيانات وجود الأنواع في مجموعة فرعية من الخلايا الكلية لمنطقة الدراسة لأن الأنواع ستشغل موائل أو مناطق مفضلة تقع ضمن النطاق الأمثل لها. من خلال مقارنة توزيع القيم للخلايا التي يحدث فيها نوع ما مقابل مجموعة الخلايا الكاملة لنفس EGV ، من الممكن تحديد مدى اختلاف هذه التوزيعات فيما يتعلق بوسائلها وتبايناتها. يسمح Biomapper بالقياس الكمي لهذا الموضع متعدد المتغيرات على أي من محاوره بناءً على مؤشر الهامش والتخصص. تم استخدام تحليل العامل لتقليل المشكلات المرتبطة بخط متعدد الخطوط والتكرار على حساب المتغيرات المرتبطة. يراعي استخدام تحليل العوامل أيضًا التفاعلات بين المتغيرات (على سبيل المثال ، الارتفاع ودرجة الحرارة) نظرًا لأن الأنواع قد تتخصص في مجموعة من المتغيرات ، بدلاً من كل متغير بشكل مستقل (Hirzel et al.2002). تختلف إجراءات تحليل العوامل المستخدمة في Biomapper اختلافًا طفيفًا عن الطرق المستخدمة على نطاق واسع مثل تحليل المكون الرئيسي. يمثل العامل الأول المحدد في ENFA جميع التهميش لنوع معين بينما تزيد جميع المحاور اللاحقة من التخصص. التهميش: الفرق بين متوسط ​​الأنواع والمتوسط ​​العالمي. كلما زادت قيمة المعامل ، زاد الفرق بين متوسط ​​الأنواع ومتوسط ​​الموطن المتاح حول المتغير المقابل. تشير القيم القريبة من 0 إلى أن النوع يفضل قيمًا أقل من المتوسط ​​فيما يتعلق بالمساحة الإجمالية ، بينما تشير القيم القريبة من 1 إلى العكس. يمكن حساب الهامش الإجمالي ، M & rsquo ، لجميع مؤشرات EGVs. يسمح هذا بإجراء مقارنات مباشرة بين الهوامش لأنواع مختلفة في نفس المنطقة. يقارن التسامح العالمي مدى اختلاف موائل الأنواع البؤرية عن الظروف المتاحة بناءً على جميع EGVs. تشير القيم المنخفضة إلى أن الأنواع متخصصة ويمكن أن تشغل جزءًا فقط من المساحة الإجمالية قيد الدراسة ، بينما تشير القيم العالية إلى الأنواع العامة. تخصص: الفرق بين تباين الأنواع والتباينات العالمية (عادةً ما يكون تباين الأنواع أصغر). العامل الأول المستخرج في ENFA هو عامل الهامشية. جميع العوامل اللاحقة هي عوامل التخصص. تشير قيمة التخصص المطلقة الأعلى إلى نطاق أكثر تقييدًا للأنواع. كل عامل له قيمة eigenvalue ، & lambda المرتبطة به ، وهو مؤشر للتخصص. تنخفض القيم الذاتية مع كل عامل (أعلى القيم هي العامل 2). تتوفر معايير مختلفة لتسهيل الاختيار ، مثل المقارنة المباشرة مع عتبة العصا المكسورة. التخصص العالمي هو عكس التسامح العالمي. يتراوح بين 1 وما لا نهاية ويصعب تفسيره مباشرة مقارنة بالهامش. تحويل البيانات وتطبيعها يتم تطبيع المتغيرات البيئية الجغرافية إلى الدرجة الممكنة قبل تشغيل التحليل في Biomapper. هذا لأن التعددية الطبيعية هي افتراض في استخراج العوامل باستخدام نظام eigensystem. عادةً ما يتم استخدام تحويل box-cox لتحويل EGVs في Biomapper بحيث تأخذ قيم البكسل لمنطقة الاهتمام بأكملها توزيعًا طبيعيًا تقريبًا. على الرغم من التوصية بالتطبيع ، إلا أن Hirzel et al. (2002) لاحظ أن طريقتهم قد تكون قوية للانحرافات عن الحياة الطبيعية. #### الحساب والنتائج تسمح القيم الذاتية للفرد بتحديد مقدار التباين (بين الوسيلة العالمية والنوع) الذي تفسره العوامل. يوفر استخدام مصفوفة النقاط (المتجهات الذاتية) إشارة إلى كيفية ارتباط العوامل بالمتغيرات. ضمن عامل يشرح مكونًا كبيرًا من التباين ، توفر المتغيرات (EGVs) التي تُظهر أعلى معامل في القيم المطلقة في هذا الجدول مزيدًا من المعلومات التي تشرح توزيع الأنواع. يتم استخراج القيم الذاتية والمتجهات الذاتية على النحو التالي: 1) يتم حساب مصفوفة W = Rs & ndash 1 * Rg (مصفوفة الارتباط العالمية Rg & ndash ، مصفوفة التغاير بين الأنواع Rs & ndash). 2) من W ، يتم استخراج عامل الهامشية ، ويتم إنشاء المصفوفة W *. يتم حساب عوامل التخصص باستخراج نظام eigensystem من W *. ثم تتم مقارنة توزيع قيم eigenvalues ​​بالتوزيعات من معيار العصا المكسورة (التوزيع المتوقع عند كسر العصا بشكل عشوائي). تعتبر القيم الذاتية الأكبر من المتوقع للتوزيع العشوائي مهمة. يسمح Biomapper للمستخدمين باستخدام واحدة من أربع خوارزميات ملائمة للموئل ، والتي تزن بيانات توزيع الأنواع بشكل مختلف. تضع الخوارزمية الوسيطة افتراضات مفادها أن الموائل المثلى هي في متوسط ​​توزيع الأنواع على كل عامل وأن هذه التوزيعات متماثلة. يتم حساب الخيار الافتراضي ، الخوارزمية المتوسطة ، عن طريق تقسيم نطاق الأنواع على كل عامل إلى 25 فئة بحيث ينقسم الوسيط إلى فئتين بالضبط. بعد ذلك ، لكل نقطة داخل الفضاء البيئي ، يتم حساب الملاحظات في نفس الفئة أو في أي فئة أخرى أبعد من المتوسط. ثم يتم تطبيع هذه القيم. يتم حساب مؤشر الملاءمة النهائي في كل نقطة باستخدام المتوسط ​​المرجح لدرجاته على كل بُعد (الوزن & كمية المعلومات التي يتم شرحها بواسطة كل بُعد). معايير اختيار خريطة ملاءمة الموائل يتم حساب ملاءمة خلية معينة بناءً على موقعها (انظر السهم) مقارنةً بتوزيع الأنواع (المدرج التكراري) على جميع العوامل المتخصصة المحددة. يتم حسابها على النحو التالي: التحقق من صحة النماذج وخرائط ملاءمة الموائل يمكن تحديد القدرة التنبؤية لخرائط ملاءمة الموائل باستخدام عملية التحقق المتبادل ، والتي تحسب فاصل الثقة حول الدقة التنبؤية لنماذج ملاءمة الموائل. يتم تحقيق ذلك عن طريق التقسيم العشوائي لمواقع الأنواع إلى مجموعات k حصرية بشكل متبادل ثم استخدام أقسام k-1 (غير متداخلة جغرافيًا) لحساب نموذج ملاءمة الموائل الجديد وبيانات الموقع & ldquobalance & rdquo للتحقق من صحة النموذج. تتكرر هذه العملية بشكل متكرر k مرة ، مع تضمين مواقع الأنواع المختلفة في مجموعات بيانات النموذج والتحقق من الصحة في كل مرة لإنشاء عدد من خرائط ملاءمة الموائل. ثم يتم استخدام مقارنة بين هذه الخرائط لاشتقاق القوة التنبؤية لخرائط ملاءمة الموائل. يتم تنفيذ هذه العمليات بناءً على طريقة طورها Boyce et al. (2002) وتعديله بواسطة Hirzel et al. (2006). #### مكونات Biomapper خريطة المتغير البيئي (EGV) هذه خرائط نقطية كمية (لا يمكن أن تكون منطقية أو فئوية) للمتغيرات البيئية المدرجة في تحليل توزيع الموائل (الأمثلة هي الارتفاع ، متوسط ​​هطول الأمطار السنوي ، المسافة الإقليدية إلى الأنهار أو كثافة السكان). في الأساس ، كل بكسل له قيمة. يتم حساب عامل الهامش عن طريق كل طبقة EGV متضمنة ، وبالتالي ، فإن وجود بيانات فئوية ، مثل خريطة الغطاء الأرضي ، سيؤدي إلى نتائج غير ذات مغزى. يوصى بتحويل الخرائط الفئوية إلى خرائط منطقية ، والتي يتم تحويلها بعد ذلك إلى خرائط المسافة والتردد. من الضروري أن يكون لجميع خرائط EVG نفس النطاق والمقياس. خريطة الأنواع هذا ملف نقطي في كود منطقي (أو ثنائي) ، والذي يحتوي على مواقع النقطة حيث تم مشاهدة الأنواع البؤرية داخل منطقة الاهتمام. يمكن أيضًا استخدام خريطة منطقية مرجحة ، مع قيم مرجحة صحيحة لبيانات وفرة الأنواع. عند توفر بيانات غياب موثوق بها ، يُقترح أنه يمكن استخدام طرق تحليل ملاءمة الموائل الأكثر تقليدية ، مثل النماذج الخطية المعممة ، بدلاً من Biomapper. ## خلفية استكشفت العديد من الدراسات العلاقات بين توافر الخدمة الصحية وجودتها والسلوكيات والنتائج الصحية [1-5]. يتطلب فحص هذه العلاقات الجمع بين البيانات المتعلقة بالنتائج الصحية مع البيانات المتعلقة ببيئة الخدمة الصحية ذات الصلة التي يتزايد الاهتمام بها في ربط هذين النوعين من البيانات [6 ، 7]. تعد المسوح الأسرية مثل المسوح الديموغرافية والصحية (DHS) مصدرًا رئيسيًا للبيانات حول الحالة الصحية للسكان وسلوك البحث عن الرعاية الصحية ، في حين أن مسوحات المرافق الصحية هي مصدر متاح بشكل متزايد للبيانات حول توافر الخدمات الصحية وجودتها. بشكل منفصل ، توفر هذه البيانات معلومات عن الطلب السكاني والبيئات الجانبية لإمداد الخدمة ، لكن الباحثين الذين يسعون إلى إثراء تحليلات بيانات صحة السكان بفهم بيئة الخدمة يقدمون رؤية محدودة للعلاقة بين الاثنين. غالبًا ما يعتمد إنشاء الروابط بين المستجيبين للمسح والمرافق الفردية على القرب الجغرافي أو تحديد المستجيبين للمرفق (المرافق) التي تمت زيارتها [8-15]. يربط نهج آخر مجموعات الأسر المعيشية بجميع المرافق داخل منطقة جغرافية في محاولة لتصوير تعرض المستجيبين للمسح لبيئة الخدمة [16–19]. يوفر التوافر المتزايد للبيانات الجغرافية في مسوحات الأسرة والمرافق فرصة لربط هذه الأنواع من البيانات معًا باستخدام التقنيات الجغرافية المكانية. يعتبر الربط الجغرافي جذابًا بشكل خاص لأنه يمكن أن يكون نهجًا فعالاً يزيد من استخدام البيانات الموجودة [20]. ومع ذلك ، فإن ربط مصادر البيانات هذه يثير عددًا من القضايا المنهجية التي لم يتم استكشافها على نطاق واسع. في هذه الورقة نستكشف القضايا المنهجية في ربط بيانات مسح الأسر المعيشية DHS مع بيانات مسح المرافق من تقييمات تقديم الخدمة (SPA). يتم جمع كلا مصدري البيانات العامة من خلال مشروع MEASURE DHS الممول من قبل الوكالة الأمريكية للتنمية الدولية (USAID) [21]. نحن نركز على مسألتين منهجيتين محددتين. أولاً ، تستخدم استطلاعات SPA عادةً عينات طبقية من المرافق العامة والخاصة المصممة لتوفير صورة وطنية لتقديم الخدمة وتقديرات تمثيلية إحصائيًا للمستوى الإداري الأول دون المستوى الوطني (على سبيل المثال ، المقاطعة أو المنطقة) التي لم يتم تصميمها عادةً لتقديمها إحصائيًا تقديرات تمثيلية على المستويات الجغرافية الدنيا [22]. أخذ العينات هو طريقة فعالة من حيث التكلفة لتوفير تقييم وطني للخدمات ولكن لها آثار على ربط بيانات مسح المرافق ببيانات مسح الأسرة المستقلة. ثانيًا ، في الاستقصاء الديموغرافي والصحي ، يتم إزاحة المواقع الجغرافية لمجموعات العينات قبل إصدارها للجمهور للحفاظ على سرية المستجيبين [23]. تم استكشاف التأثير المحتمل لهذا الإزاحة على ربط البيانات بين مجموعات المسح وبيانات التعداد السكاني ، ولكن ليس بين المجموعات والمرافق [24]. الهدف من هذه الورقة هو استكشاف خطأ التصنيف الخاطئ المحتمل الذي يتم تقديمه عند استخدام عينة بدلاً من تعداد المرافق الصحية وعندما يتم تهجير مجموعات مسح الأسر المعيشية جغرافياً. نحن نستخدم عددًا من الأساليب المختلفة لربط بيانات الأسرة ببيانات المرافق الصحية جغرافيًا لاستكشاف مدى اختلاف أخطاء القياس المرتبطة بأخذ عينات المنشأة وإزاحة المجموعات عبر طرق الربط الجغرافي الشائعة الاستخدام. اعتُبرت هذه الدراسة معفاة من المراجعة من قبل مكتب أخلاقيات البحث البشري بجامعة نورث كارولينا في تشابل هيل. تشير المعلومات الجغرافية التطوعية (VGI) إلى البيانات ذات المرجعية الجغرافية التي أنشأها المواطنون المتطوعون. انتشر VGI في السنوات الأخيرة بسبب تقدم التقنيات التي تمكن الجمهور من المساهمة بالبيانات الجغرافية. إن VGI ليست فقط آلية مبتكرة لإنتاج البيانات الجغرافية ومشاركتها ، ولكنها قد تؤثر أيضًا بشكل كبير على GIScience والجغرافيا وعلاقتها بالمجتمع. على الرغم من مزايا VGI ، تخضع جودة بيانات VGI للتدقيق المستمر لأن تقييم الجودة هو الأساس للمستخدمين لتقييم مدى ملاءمتها لاستخدامها في التطبيقات. تم اقتراح العديد من الأساليب العامة لضمان جودة بيانات VGI ولكن تم تطوير عدد قليل فقط من الطرق لمعالجة تحيزات VGI. هناك حاجة ماسة للطرق التحليلية التي يمكن أن تستوعب التمثيل غير الكامل والتحيزات في VGI للاستخدام الاستدلالي حيث يتم استنتاج الظواهر الأساسية ذات الأهمية من عينة من ملاحظات VGI. يضيف استخدام VGI للاستدلال والنمذجة قيمة كبيرة إلى VGI. لذلك ، فإن معالجة مسألة التمثيل وتحيزات VGI أمر مهم لتحقيق إمكانات VGI. الخصوصية والأمان هي أيضا قضايا مهمة. على الرغم من استخدام VGI في العديد من المجالات ، فمن المستحسن إجراء المزيد من الأبحاث لتلبية الاحتياجات الفكرية والعلمية الأساسية التي لا تزال قائمة في هذا المجال. تشانغ ، ج. (2021). معلومات جغرافية تطوعية. الهيئة المعرفية لعلوم وتكنولوجيا المعلومات الجغرافية (الإصدار الأول من الربع 2021) ، جون ب.ويلسون (محرر). DOI: 10.22224 / gistbok / 2021.1.1 تم نشر هذا الإدخال لأول مرة في 4 يناير 2021. لا توجد طبعات سابقة. الويب 2.0: مجموعة من التقنيات التي تسخر الويب بطريقة أكثر تفاعلية وتعاونية ، مع التركيز على التفاعل الاجتماعي والذكاء الجماعي. يسمح Web 2.0 للمستخدمين بالوصول إلى المحتوى من مواقع الويب والمساهمة فيها. محتوى ناتج عن طريق مستخدم: أي شكل من أشكال المحتوى الذي تم نشره من قبل المستخدمين على منصات الإنترنت ، على سبيل المثال ، الصور ومقاطع الفيديو والنصوص والصوت التي يساهم بها مستخدمو وسائل التواصل الاجتماعي والمساهمون في الويكي. المراجع الجغرافية: تحديد الموقع الجغرافي لكائن أو كيان أو ظاهرة أو صورة أو مفهوم أو بيانات أو معلومات باستخدام معلمات أو رمز أو مكان عالمي. العلامات الجغرافية: عملية إضافة البيانات الوصفية للتعريف الجغرافي المكاني إلى أنواع مختلفة من الوسائط. التعهيد الجماعي: ممارسة الحصول على الخدمات أو الأفكار أو المحتوى المطلوب من خلال التماس المساهمات من مجموعة كبيرة من الأشخاص وخاصة من المجتمع عبر الإنترنت. علم المواطن: العمل العلمي الذي يضطلع به أفراد من عامة الناس ، غالبًا بالتعاون مع العلماء المتخصصين والمؤسسات العلمية أو تحت إشرافهم. الجغرافيا العصبية: استخدام التقنيات والأدوات الجغرافية للأنشطة الشخصية والمجتمعية أو من قبل مجموعة غير خبراء من المستخدمين. رسم الخرائط التشاركية: مناهج وتقنيات تجمع بين أدوات رسم الخرائط الحديثة والأساليب التشاركية لتسجيل وتمثيل المعرفة المكانية للمجتمعات المحلية. مشاركة الجمهور GIS: استخدام نظم المعلومات الجغرافية لتوسيع المشاركة العامة في صنع السياسات وكذلك لقيمة نظم المعلومات الجغرافية لتعزيز أهداف المنظمات غير الحكومية ، والمجموعات الشعبية ، والمنظمات المجتمعية. المعلومات الجغرافية التطوعية (VGI) هي مصطلح شامل يشير إلى البيانات ذات المرجعية الجغرافية التي أنشأها المواطنون المتطوعون (Goodchild ، 2007). يشمل VGI على نطاق واسع البيانات الجغرافية التي يساهم بها متطوعون غير محترفين مثل المشاركين في علوم المواطن ، والتعهيد الجماعي ، والجغرافيا الجديدة ، ورسم الخرائط التشاركية ، والمشاركة العامة GIS ، وما إلى ذلك ، ومستخدمي الوسائط الاجتماعية (الشكل 1) ، طالما أنهم يتشاركون في خصائص التطوع و مساهمة البيانات الجغرافية غير الخبراء. ومع ذلك ، فإن VGI هو مجرد تعميم فضفاض للبيانات الجغرافية الناتجة عن هذه المصادر. لكل من المصطلحات التي تمثل المصادر اختلافات دلالة مختلفة قليلاً ولكنها مهمة (Sieber ، 2006). في كثير من الحالات ، قد يكون من الصعب التعامل مع البيانات على أنها "تطوعية" ، على سبيل المثال ، المحتوى الذي ينشئه المستخدم مع أنظمة المراقبة ، وتتبع صفحات الويب وملفات تعريف الارتباط ، وما إلى ذلك. من الطبيعة الطوعية لمساهمة البيانات ، فإن مصطلح "متطوع" دائمًا ما يجلس بشكل غير مريح جنبًا إلى جنب مع الممارسات الفعلية التي يرتبط بها الأشخاص. أمثلة على VGI هي شبكات الطرق في العالم التي امتثلها مساهمو OpenStreetMap (OSM) (Haklay & amp Weber ، 2008) ، وسجلات حدوث الأنواع في جميع أنحاء العالم التي ساهمت بها eBirders (Sullivan et al. ، 2014) ، والمنشورات ذات العلامات الجغرافية على وسائل التواصل الاجتماعي. تم استخدام VGI في مجموعة متنوعة من التطبيقات مثل المراقبة البيئية (على سبيل المثال ، مشاهدة الأنواع ، والملاحظات الفينولوجية) ، وإدارة الأراضي ، والتحقق من خريطة الغطاء الأرضي ، والخدمات القائمة على الموقع (على سبيل المثال ، التوجيه والملاحة) ، والاستجابة للكوارث والعمل الإنساني (انظر Yan، Feng، Huang، Fan، & amp Wang، 2020 والمراجع الواردة فيه) ، أبحاث التنقل البشري (Jurdak et al. ، 2015) ، الصحة العامة (Goranson ، Thihalolipavan ، & amp di Tada ، 2013) ، تحليل الجريمة والشرطة المجتمعية (Jelokhani -Niaraki، Bastami Mofrad، Yazdanpanah Dero، Hajiloo، & amp Sadeghi-Niaraki، 2019 White & amp Roth، 2010) ، مشاركة البيانات المكانية بخصوص تقييمات الأعمال (Rahimi، Mottahedi، & amp Liu، 2018)، كاميرات السرعة، حوادث المرور، إغلاق البنية التحتية ( www.waze.com/livemap) ، إلخ. انتشر VGI بشكل أساسي بسبب تقدم التقنيات التي تمكن الجمهور من المساهمة بالبيانات الجغرافية. مع تمكين Web 2.0 والوصول في كل مكان إلى الإنترنت وخدمات تحديد المواقع ، يمكن للمواطنين العاديين الذين يعملون كـ "أجهزة استشعار بشرية" باستخدام الهواتف الذكية المحمولة وغيرها من الأجهزة المحمولة التي تدرك الموقع أن يساهموا بسهولة في الملاحظات ذات المرجعية الجغرافية فيما يتعلق بالبيئات الاجتماعية والطبيعية في العالم ، كشكل محدد من أشكال المحتوى الذي ينشئه المستخدم. يمثل VGI نقلة نوعية في إنتاج البيانات الجغرافية ومشاركتها ومحتواها وخصائصها (Elwood، Goodchild، & amp Sui، 2012). قد يؤثر بشكل كبير على نظم المعلومات الجغرافية والجغرافيا وعلاقتها بالمجتمع (Goodchild، 2007). يعد VGI أيضًا مصدرًا مهمًا للبيانات الجغرافية المكانية الكبيرة التي قد تدفع البحث الجغرافي نحو نهج "يعتمد على البيانات" (Miller & amp Goodchild ، 2014). الشكل 1. تقنيات تمكين VGI والمصادر ومجالات التطبيق (انظر القسم 1 للتعرف على المصطلحات). المصدر: المؤلف. وفقًا لـ Sui and Cinnamon (2016) ، يمكن تصنيف VGI بشكل فضفاض إلى ثلاثة أنواع: بيانات الإطار الجغرافي المكاني ، وبيانات المعاجم ، والبيانات الموضوعية. من بين مواضيع بيانات الإطار الجغرافي ، يساهم VGI بشكل كبير في إنتاج بيانات شبكات النقل والطرق. OSM (www.openstreetmap.org) عبارة عن منصة VGI نموذجية يقوم فيها المساهمون المتطوعون بتجميع الشوارع والطرق التفصيلية (وغيرها من الميزات) لمعظم أنحاء العالم عن طريق تحميل مسارات GPS أو تتبع ورقمنة الميزات الجغرافية من صور الأقمار الصناعية عالية الدقة (Haklay و ويبر ، 2008). المعجم الجغرافي ، الذي يهتم بربط أسماء الأماكن بأماكن معينة ، مكلف في الإنشاء والصيانة باستخدام الأساليب التقليدية ولكنه مناسب تمامًا لنهج VGI. Wikimapia (wikimapia.org) هو مشروع VGI يجمع معلومات حول الأماكن حول العالم لإنشاء معاجم جغرافية يرسم المتطوعون مضلعات تمثل الأماكن في مناطقهم المحلية على خريطة قاعدة الصور ويساهمون بأسماء وأوصاف الأماكن المرتبطة (Ballatore and Jokar Arsanjani، 2019) . توفر VGI الأخرى معلومات موضوعية متعددة الاستخدامات للظواهر الجغرافية ، على سبيل المثال ، التغريدات ذات العلامات الجغرافية التي تلتقط مشاهد حريق هائل ، والإدخالات ذات المرجعية الجغرافية التي تبلغ عن مشاهدات الطيور. ينتج هذا النوع من VGI معلومات جغرافية غنية تكشف عن الديناميكيات الزمانية المكانية للظواهر الأساسية وبالتالي فهي ذات أهمية كبيرة لمجموعة متنوعة من مجالات التطبيق. على سبيل المثال ، يتم استخدام الوسائط الاجتماعية ذات العلامات الجغرافية كنهج جديد "للاستشعار الاجتماعي" لفهم البيئات الاجتماعية والاقتصادية (Liu et al. ، 2015) تُستخدم السجلات التي يساهم بها مراقبو الطيور في eBird (ebird.org) يوميًا في دراسة توزيع الطيور وهجرتها (سوليفان وآخرون ، 2014). يتمتع VGI بالعديد من المزايا كآلية مبتكرة لاكتساب وتجميع البيانات الجغرافية التي يمكن أن تكشف عن الديناميكيات الزمانية المكانية للظواهر الاجتماعية والطبيعية. أولاً ، تمتلك VGI القدرة على توفير البيانات الجغرافية عبر مناطق واسعة ، حيث وصلت آثار أقدام الإنسان إلى معظم أنحاء العالم. OpenStreetMap و Wikimapia و eBird كلها مشروعات VGI على نطاق عالمي تقوم بتجميع مجموعات البيانات في جميع أنحاء العالم. علاوة على ذلك ، يحتوي VGI على معلومات محلية غنية قد تمتد عبر طيف زمني واسع لأن المواطنين كخبراء محليين تراكموا المعرفة ببيئاتهم على مدى فترات زمنية طويلة. على هذا النحو ، تُستخدم مشاهدة الحياة البرية في الفترات التاريخية لدراسة تغيرات الموائل بمرور الوقت (Zhang et al. ، 2018). يمكن أن يوفر VGI أيضًا معلومات جغرافية محدثة في الوقت المناسب يصعب الحصول عليها من خلال بروتوكولات جمع البيانات الجغرافية التقليدية (مثل أخذ العينات المخطط لها والمسح) ولكن يمكن جمعها بسهولة من قبل المواطنين المتطوعين على الأرض (على سبيل المثال ، تقارير الأضرار بعد كارثة كبرى). أخيرًا ، يتميز VGI بتكاليف أقل بكثير مقارنة ببروتوكولات جمع البيانات التقليدية. وقد جعل ذلك من الممكن إنتاج مجموعات بيانات جغرافية واسعة النطاق من خلال مبادرات VGI (سوليفان وآخرون ، 2009). تخضع جودة بيانات VGI للفحص المستمر. نظرًا لأن عامة الناس المشاركين في إنشاء VGI لا يتألفون من محترفين مدربين جيدًا وأن إجراءات جمع البيانات التطوعية الخاصة بهم مقيدة في الغالب بالالتزام الداخلي ، فقد تكون البيانات التي تم جمعها بواسطة المتطوعين دقيقة وقد لا تكون دقيقة (Goodchild، 2007). يوفر تقييم جودة بيانات VGI المعلومات الأساسية للمستخدمين لتقييم مدى ملاءمة استخدام VGI في التطبيقات. غالبًا ما يتم تقييم جودة VGI من خلال فحص مصداقية مصدر VGI (Flanagin & amp Metzger ، 2008) ومؤشرات جودة البيانات المكانية مثل الدقة الموضعية ودقة السمات والدقة الزمنية والدقة الدلالية والاتساق المنطقي والاكتمال والنسب (Goodchild & amp Li ، 2012) . لقد وجدت العديد من الدراسات أن جودة بيانات VGI مرضية فيما يتعلق بهذه الأبعاد. على سبيل المثال ، Olteanu-Raimond et al. وجد (2016) أن الكثير من بيانات VGI تم الحصول عليها بدقة موضعية ، على الرغم من أنها أقل من تلك التي تحصل عليها عادةً وكالات رسم الخرائط المهنية ، إلا أنها تجاوزت متطلبات مقياس التقاط البيانات الاسمي الذي تستخدمه معظم الوكالات. تم تلخيص الأساليب العامة لضمان جودة VGI هنا بشكل موجز بناءً على وفرة من الأبحاث (Goodchild & amp Li، 2012 Haklay، 2016 Senaratne، Mobasheri، Ali، Capineri، & amp Haklay، 2017): (1) "التعهيد الجماعي" - باستخدام a مجموعة للتحقق من صحة الأخطاء التي يرتكبها أحد المساهمين وتصحيحها ، (2) أفراد "اجتماعيون" - أفراد موثوق بهم يعملون كحراس للحفاظ على جودة المساهمات والتحكم فيها ، (3) "جغرافيًا" - استخدام المعرفة الجغرافية لتقييم جودة البيانات ، ( 4) "المجال" - استخدام المعرفة الخاصة بالمجال لتقييم جودة البيانات ، (5) التنقيب في البيانات ، اكتشاف الأنماط بالتعلم فقط من البيانات لتقييم جودة البيانات ، (6) "الملاحظة الآلية" - إزالة بعض جوانب الذاتية البشرية في جمع البيانات من خلال الاعتماد على معدات دقيقة لتحسين جودة البيانات ، و (7) "موجهون نحو العملية" - يخضع المشاركون للتدريب قبل جمع البيانات لضمان جودة البيانات. تتم إحالة القراء المهتمين بتفاصيل كل نهج إلى المراجع الأصلية. يمثل التمثيل جانبًا مهمًا آخر من جوانب جودة بيانات VGI ذات الصلة بشكل خاص باستخدام VGI التي تحتوي على معلومات موضوعية للنمذجة والاستدلال. يشير تمثيل VGI إلى الدرجة التي يمكن أن تمثل بها "عينة" تتكون من ملاحظات VGI "السكان" الأساسي. الملاحظات في مجموعة بيانات VGI هي عينة مأخوذة من الكون لجميع حالات الظاهرة الجغرافية الأساسية (أي السكان) (Jensen & amp Shumway ، 2010). تتطلب التحليلات التي تتضمن استنتاج خصائص المجتمع الأساسي من عينة أن تكون العينة "ممثلة". على سبيل المثال ، يمكن استنتاج رأي مجموعة أكبر من الأشخاص من التغريدات فقط إذا كان مستخدمو Twitter الذين تم أخذ عينات منهم يشكلون عينة "تمثيلية" لتلك المجموعة. تتطلب نمذجة توزيع الأنواع سجلات تمثيلية للأنواع كمدخلات بحيث يكون التوزيع النموذجي مؤشراً على التوزيع الحقيقي للأنواع. يوفر تقييم الطابع التمثيلي لـ VGI معلومات حيوية حول تحديد ما إذا كان VGI مناسبًا لمثل هذه التحليلات. التحيزات الديموغرافية في المساهمين هي السبب الرئيسي الذي يعوق تمثيل VGI لتمثيل مجموعة أكبر من الناس (Liu، Yuan، & amp Zhang، 2020 Malik، Lamba، Nakos، & amp Pfeffer، 2015). تكمن المشكلة الأساسية وراء مثل هذه التحيزات في أنه لا يتمتع جميع المواطنين بفرصة متساوية للمساهمة في VGI لأسباب تشمل (على سبيل المثال لا الحصر) الفجوة الرقمية (على سبيل المثال ، الفجوة الحضرية / الريفية ، وعدم المساواة في الوصول إلى التكنولوجيا) (Hecht & amp Stephens ، 2014 Sui، Goodchild، & amp Elwood، 2013). على سبيل المثال ، تأتي معظم المساهمات في eBird من المناطق المتقدمة في العالم ، وتقع المناطق التي تم أخذ عينات منها بشكل مكثف بالقرب من المدن الكبيرة (الشكل 2) (Zhang ، 2020). التحيز المكاني هو مشكلة شائعة أخرى في VGI (Zhang & amp Zhu ، 2018). يقرر المتطوعون الفرديون مكان إجراء الملاحظات وغالبًا ما تكون جهود المراقبة الخاصة بهم "مخصصة" وذات طبيعة انتهازية ، والتي تختلف اختلافًا جذريًا عن أخذ العينات الجغرافية التقليدية التي يتم فيها اختيار مواقع المراقبة بعناية لضمان أن تكون مجموعة الملاحظات تمثيلية. نتيجة لذلك ، غالبًا ما تكون سجلات VGI أكثر تركيزًا في بعض المناطق الجغرافية (على سبيل المثال ، المناطق المكتظة بالسكان أو التي يسهل الوصول إليها) (Zhang ، 2020). بسبب هذا التحيز المكاني ، قد لا يكون VGI ممثلًا للتباين المكاني للظواهر الجغرافية الأساسية (الشكل 2). يتم التعرف على التحيزات في VGI والاعتراف بها على نطاق واسع ، ولكن تم تطوير عدد قليل فقط من الطرق لمعالجة مثل هذه التحيزات لتحسين تمثيل ملاحظات VGI من أجل نمذجة وتنبؤات مكانية أكثر موثوقية (Zhang & amp Zhu ، 2019). الشكل 2. عدد الأنواع التي تم الإبلاغ عنها إلى eBird (اعتبارًا من 31 ديسمبر 2019) التي تم تعيينها عبر شبكة من خلايا خطوط الطول 0.25 درجة × 0.25 درجة. الأنواع التي تم الإبلاغ عنها منحازة نحو المناطق الجغرافية المكتظة بالسكان والتي يسهل الوصول إليها ، والتي لا تمثل بالضرورة التباين المكاني الحقيقي لتنوع الطيور. المناطق الجغرافية التي بها المزيد من الأنواع هي في الغالب مناطق متطورة من العالم ومناطق قريبة من المدن الكبيرة ، مما يعكس الفجوة الرقمية (على سبيل المثال ، عدم المساواة في الوصول إلى التكنولوجيا والبنية التحتية). المصدر: المؤلف. الخصوصية والأمان من المخاوف الخطيرة المرتبطة بـ VGI. المتطوعون الذين يساهمون ببيانات جغرافية في منصة VGI أو قاعدة بيانات غالبًا ما يعرضون مواقعهم ، بشكل نشط أو سلبي ، عن طيب خاطر أو عن غير قصد. تجعل مساهمات VGI المتراكمة من الممكن تتبع مواقع المستخدمين الفرديين ، مما قد يشكل مخاوف خطيرة تتعلق بالخصوصية والأمن لهم (Elwood et al. ، 2012 Sui & amp Cinnamon ، 2016). من ناحية أخرى ، يجب أن تجعل منصات VGI مساهمي VGI على دراية كاملة بالاستخدام المقصود للبيانات التي يساهمون بها ، وهو أمر مهم بشكل خاص في الحالات التي يتم فيها جمع VGI بشكل سلبي ولا يفهم المستخدمون تمامًا العملية وعواقبها. من ناحية أخرى ، يحتاج المساهمون في VGI إلى توخي الحذر عند مشاركة مواقعهم أو الكشف عن أي معلومات حساسة (على سبيل المثال ، تحديد الهوية) لتقليل مخاطر انتهاك الخصوصية وانتهاك الأمن. على سبيل المثال ، عند استخدام تطبيقات الأجهزة المحمولة للمساهمة في VGI ، غالبًا ما يتم جمع معلومات الموقع والوقت تلقائيًا بدقة عالية. تتيح هذه المعلومات إمكانية إعادة بناء المسارات الزمانية المكانية للمساهمين ، مما يشكل مخاطر على المساهمين (على سبيل المثال ، المطاردة). تقدم بعض تطبيقات VGI للأجهزة المحمولة خيارًا لإخفاء الإحداثيات الجغرافية عند إرسال الملاحظات (على سبيل المثال ، iNaturalist). قد يستخدم المساهمون هذا الخيار لإخفاء الملاحظات التي يتم إجراؤها في مواقع حساسة (على سبيل المثال ، بالقرب من منازلهم). علاوة على ذلك ، يجب أن تكون هناك لوائح معمول بها لحماية خصوصية بيانات VGI ، تمامًا مثل أي بيانات مستخدم أخرى. على سبيل المثال ، يخضع استخدام بيانات OSM مع حقول البيانات الوصفية التي من المحتمل أن تكشف عن هوية المساهم (مثل اسم المستخدم ومعرف المستخدم) للوائح حماية البيانات في الاتحاد الأوروبي لأن بعض المساهمين في OSM يعيشون في الاتحاد الأوروبي. Use of the OSM data may be limited to OSM internal purposes, e.g. quality assurance. Any derived databases and works should be only accessible to OSM contributors. The use of VGI data is often constrained by terms and conditions specified in respective data licenses and related documentations. Most VGI data are open and free for non-commercial uses. However, users may or may not distribute the data depending upon particular data licenses. For instance, users are free to copy, distribute, transmit and adapt OSM data under the same license, as long as credit is attributed to OSM and its contributors. Users can download the publicly available eBird data directly from the site but are prohibited from passing the data to others. VGI contributors often hold copyright of the creative materials they contribute such as photos, audios and videos although the hosting VGI platform may by default assume the right to use the materials or sublicense the materials to a third party for non-commercial uses. Data quality of VGI is at the core of VGI applications in various domains. Among the dimensions of VGI data quality discussed above, assessing the fundamental aspects of spatial data quality (e.g., positional accuracy, attribute accuracy) may provide sufficient information for evaluating the fitness for use of the first two types of VGI (geographic framework data, gazetteer data). Nonetheless, these aspects alone provide little insights on the representativeness of VGI observations, which in many cases is crucial for using the third type of VGI (thematic data) in modeling (e.g., inferring the opinion of a larger group of people from tweets modeling and predicting species distribution from species occurrence data reported by volunteers). Although various forms of biases in VGI have been identified and widely acknowledged, there are only limited methodological developments for tackling such biases. Research on data quality of VGI currently focuses more on issues at the data collection stage rather than on the impacts of the issues on VGI applications (e.g., modeling). Analytical methods that can accommodate and mitigate the biases are much needed for better using VGI in inferential analyses where the underlying phenomena of interest are inferred from a sample of VGI observations. The use of VGI for inference and modeling adds much value to VGI. Therefore, addressing the issue of representativeness and biases of VGI is necessary to fulfill the full potential of VGI. VGI is still an active research field that keeps evolving. While VGI are used in areas that previously relied on traditional data sources and there will always be needs for technical research around data quality, representativeness, etc., VGI is also being used to solve new problems as VGI is producing new data at spatial and temporal scales that were never possible to collect in the past (Goodchild, Aubrecht, & Bhaduri, 2017). For instance, eBird data are used for modeling avian full annual cycle distribution and population trends in the Americas (Fink et al., 2020), and the opportunities offered by crowdsourcing are exploited to generate traffic network databases to aid autonomous driving (Szántó & Vajta, 2019). The past decade or so has witnessed applications of VGI in a wide array of domains. Nonetheless, more future research is desirable to address the fundamental intellectual and scholarly needs that persist in the field, for example, understanding more fully how VGI operates, its implications, assumptions, limitations, affordances, etc., all are intrinsically important issues across VGI applications. Ballatore, A., & Jokar Arsanjani, J. (2019). Placing Wikimapia: an exploratory analysis. International Journal of Geographical Information Science, 33(8), 1633–1650. Elwood, S., Goodchild, M. F., & Sui, D. Z. (2012). Researching volunteered geographic information: Spatial data, geographic research, and new social practice. حوليات جمعية الجغرافيين الأمريكيين, 102(3), 571–590. Fink, D., Auer, T., Johnston, A., Ruiz-Gutierrez, V., Hochachka, W. M., & Kelling, S. (2020). Modeling avian full annual cycle distribution and population trends with citizen science data. Ecological Applications, 30(3), 1–16. DOI: 10.1002/eap.2056 Flanagin, A., & Metzger, M. (2008). The credibility of volunteered geographic information. GeoJournal, 72(3), 137–148. DOI: 10.1007/s10708-008-9188-y Goodchild, M. F. (2007). Citizens as sensors: the world of volunteered geography. Geojournal, 69(4), 211–221. DOI: 10.1007/s10708-007-9111-y Goodchild, M. F., Aubrecht, C., & Bhaduri, B. (2017). New questions and a changing focus in advanced VGI research. Transactions in GIS, 21(2), 189–190. 10.1111/tgis.12242 Goodchild, M. F., & Li, L. (2012). Assuring the quality of volunteered geographic information. Spatial Statistics, 1, 110–120. https://doi.org/http://dx.doi.org/10.1016/j.spasta.2012.03.002 Goranson, C., Thihalolipavan, S., & di Tada, N. (2013). VGI and public health: possibilities and pitfalls. In G. M. Sui D., Elwood S. (Ed.), Crowdsourcing geographic knowledge (pp. 329–340). Dordrecht, Netherlands: Springer. Haklay, M. (2016). Volunteered Geographic Information: Quality Assurance. International Encyclopedia of Geography: People, the Earth, Environment and Technology: People, the Earth, Environment and Technology, 1–6. Haklay, M., & Weber, P. (2008). OpenStreetMap: user-generated street maps. Pervasive Computing, IEEE, 7(4), 12–18. Hecht, B., & Stephens, M. (2014). A tale of cities: Urban biases in volunteered geographic information. Proceedings of the Eighth International Conference on Web and Social Media (ICWSM), June 1 - 4, 197–205. Ann Arbor, United States. Jelokhani-Niaraki, M., Bastami Mofrad, R., Yazdanpanah Dero, Q., Hajiloo, F., & Sadeghi-Niaraki, A. (2019). A volunteered geographic information system for monitoring and managing urban crimes: a case study of Tehran, Iran. Police Practice and Research, 1–15. Jensen, R. R., & Shumway, J. M. (2010). Sampling our world. In B. Gomez & J. P. Jones III (Eds.), Research Methods in Geography: A Critical Introduction (pp. 77–90). John Wiley & Sons. Jurdak, R., Zhao, K., Liu, J., AbouJaoude, M., Cameron, M., & Newth, D. (2015). Understanding Human Mobility from Twitter. PLOS ONE, 10(7), e0131469. DOI: 10.1371/journal.pone.0131469 Liu, Y., Liu, X., Gao, S., Gong, L., Kang, C., Zhi, Y., … Shi, L. (2015). Social Sensing: A New Approach to Understanding Our Socioeconomic Environments. حوليات جمعية الجغرافيين الأمريكيين, 105(3), 512–530. DOI: 10.1080/00045608.2015.1018773 Liu, Y., Yuan, Y., & Zhang, F. (2020). Mining urban perceptions from social media data. Journal of Spatial Information Science, 20(20), 51–55. DOI: 10.5311/JOSIS.2020.20.665 Malik, M. M., Lamba, H., Nakos, C., & Pfeffer, J. (2015). Population Bias in Geotagged Tweets. Nineth International AAAI Conference on Web and Social Media, May 26–29, 18–27. Oxford, United Kingdom. Miller, H. J., & Goodchild, M. F. (2014). Data-driven geography. GeoJournal, 80(4), 449–461. DOI: 10.1007/s10708-014-9602-6 Olteanu-Raimond, A.-M., Hart, G., Foody, G. M., Touya, G., Kellenberger, T., & Demetriou, D. (2017). The Scale of VGI in Map Production: A Perspective on European National Mapping Agencies. Transactions in GIS, 21(1), 74–90. DOI: 10.1111/tgis.12189 Rahimi, S., Mottahedi, S., & Liu, X. (2018). The geography of taste: Using YelP to study urban culture. ISPRS International Journal of Geo-Information, 7(9). DOI: 10.3390/ijgi7090376 Senaratne, H., Mobasheri, A., Ali, A. L., Capineri, C., & Haklay, M. (Muki). (2017). A review of volunteered geographic information quality assessment methods. International Journal of Geographical Information Science, 31(1), 139–167. DOI: 10.1080/13658816.2016.1189556 Sieber, R. (2006). Public participation geographic information systems: A literature review and framework. حوليات جمعية الجغرافيين الأمريكيين, 96(3), 491–507. Sui, D., & Cinnamon, J. (2016). Volunteered geographic information. International Encyclopedia of Geography: People, the Earth, Environment and Technology: People, the Earth, Environment and Technology, 1–13. Sui, D., Goodchild, M., & Elwood, S. (2013). Volunteered geographic information, the exaflood, and the growing digital divide. In D. Sui, S. Elwood, & M. Goodchild (Eds.), Crowdsourcing Geographic Knowledge: Volunteered Geographic Information (VGI) in Theory and Practice (pp. 1–12). Dordrecht: Springer Netherlands. DOI: 10.1007/978-94-007-4587-2 Sullivan, B. L., Aycrigg, J. L., Barry, J. H., Bonney, R. E., Bruns, N., Cooper, C. B., … Kelling, S. (2014). The eBird enterprise: An integrated approach to development and application of citizen science. Biological Conservation, 169, 31–40. DOI: 10.1016/j.biocon.2013.11.003 Sullivan, B. L., Wood, C. L., Iliff, M. J., Bonney, R. E., Fink, D., & Kelling, S. (2009). eBird: A citizen-based bird observation network in the biological sciences. Biological Conservation, 142(10), 2282–2292. DOI: 10.1016/j.biocon.2009.05.006 Szántó, M., & Vajta, L. (2019). Introducing CrowdMapping: A Novel System for Generating Autonomous Driving Aiding Traffic Network Databases. 2019 International Conference on Control, Artificial Intelligence, Robotics & Optimization (ICCAIRO), 7–12. DOI: 10.1109/ICCAIRO47923.2019.00010 White, J. J. D., & Roth, R. E. (2010). TwitterHitter: Geovisual analytics for harvesting insight from volunteered geographic information. Proceedings of GIScience, 2010. Yan, Y., Feng, C., Huang, W., Fan, H., & Wang, Y. (2020). Volunteered geographic information research in the first decade : a narrative review of selected journal articles in GIScience. International Journal of Geographical Information Science, 00(00), 1–27. DOI: 10.1080/13658816.2020.1730848 Zhang, G. (2020). Spatial and Temporal Patterns in Volunteer Data Contribution Activities: A Case Study of eBird. ISPRS International Journal of Geo-Information, 9(10), 597. DOI: 10.3390/ijgi9100597 Zhang, G., & Zhu, A.-X. (2018). The representativeness and spatial bias of volunteered geographic information: a review. Annals of GIS, 24(3), 151–162. DOI: 10.1080/19475683.2018.1501607 Zhang, G., & Zhu, A.-X. (2019). A representativeness directed approach to spatial bias mitigation in VGI for predictive mapping. International Journal of Geographical Information Science, 33(9), 1873–1893. DOI: 10.1080/19475683.2018.1501607 Zhang, G., Zhu, A.-X., Huang, Z.-P., Ren, G., Qin, C.-Z., & Xiao, W. (2018). Validity of historical volunteered geographic information: Evaluating citizen data for mapping historical geographic phenomena. Transactions in GIS, 22(1), 149–164. DOI: 10.1111/tgis.12300 ## Randomly distributed cases according to census data - Geographic Information Systems نظم المعلومات الجغرافية in environmental contamination is the use of نظم المعلومات الجغرافية software in mapping out the contaminants in soil and water using the spatial interpolation tools from نظم المعلومات الجغرافية. نظم المعلومات الجغرافية Commons: An Introductory Textbook on Geographic Information Systems This is not a typical e-book it is a free, web-based, open-source 'textbook' available to anyone interested in using mapping tools to create maps. نظم المعلومات الجغرافية Application نظم المعلومات الجغرافية application - Source: OpenGIS Guide "The use of capabilities, including hardware, software and data, provided by a Geographic Information System specific to the satisfaction of a set of user requirements. services rendered by AABSyS allow for the visualization of geographic data, analysis of spatial relationships, and efficient data management. Data set 5.5 Ancillary documentation: what to supply and why Possibly the single most important piece of information you can provide above and beyond the Dublin Core catalogue entries discussed above is an idea of your data model. maps do more than display and analyze data-they also tell powerful stories. All the examples featured in this gallery manage to inspire, distinguish, promote, intrigue, or elevate their subject matter. . Tutorial consists of a three-part movie accompanied by hands-on exercises. programming: An overview". After reading it I felt a bit disappointed though. Analysis Functions Outline Spatial Data Functions Attribute Functions Integrated Analysis of Spatial and Attribute Data Cartographic Modeling . and Networking "A little learning is a dang'rous thing." - Alexander Pope . Glossary of Terms Aerial Photography The process of taking photography from an aircraft using specialized photographic equipment. can help uncover the full value of this information. Data from Libraries The Tufts Open Geo Portal is an exciting project that lets you search and discover thousands of datasets from several libraries. Data from National and International Mapping Agencies . أنواع البيانات Raster Data Data which occurs in a regularly spaced grid. على سبيل المثال a satellite image or digital terrain map. Region settings determine the spatial extent and resolution of the grid. Geographic Information System, a system for capturing, storing, analyzing, and managing data and associated attributes which are spatially referenced to the earth. قائمة المصطلحات Share & Bookmark Press Enter to show all options, press Tab go to next option Font Size: + - . technology involves comparing natural features with human activity. can be distinguished by listing the types of questions it can (or should be able to) answer as opposed to being described: a) through formal definitions, and b) through its ability to carry out spatial operations, and linking data sets together with location as the common key. " is probably "doing science" as well. Users - GISTutor.com How to Georeference Images taken from GPS Enabled Cameras using Google Earth 1 2 3 4 5 . Group Wyoming Department of Transportation Geographic Information Systems Standards Wyoming Department of Transportation Geographic Information Systems/Intelligent Transportation Systems Program . has advantages over manually producing maps: Quick reproduction time Data updates are reflected on newly printed maps Errors are easily fixed "Single use" maps are possible within time and budget constraints . data*. It comes with wrappers for OGR and GDAL. I recently had to work with DGN file. How I buil. 16 hours ago . ) is a system for creating, storing, analyzing, managing and presenting spatial data and its associated attributes. software settings that allow users to control the conversion of raster data to vector data. For example, vectorization settings may allow users to select which raster cells are eligible for vectorization or specify how the geometry of the output vector data will be constructed during vectorization. -centric perspective, we are doing a bang-up job. Lest I sound like a mal-content, let me challenge that observation. is is to produce data visualizations in the form of a map. The idea being that each visualization is communicating something that might not be obvious from the raw data alone. data layers that are part of the ACE Basin Characterization. and pages created at USGS for this CD series. , it may be helpful to become familiar with the following terms and concepts: . tools, spatial data models, data production, interpolation, classification, artificial neural networks, wavelet transformation. 0. Introduction . The first 2 digits are the state code (not shown on the map in the viewer). The last 5 digits are the unique number assigned to identify the wellbore. . MANAGER BUTTON FUNCTIONS Top Row Open new map display Open a new map display and resets layer tree. Add raster layer Adds a raster map to the layer tree. Tutorial Appendix: Internet Resources for Crime Mapping GISTutorial Workbook Appendix: Internet Resources for Crime Mapping . Data is collected by data layer or "theme". . . . . . such as boundaries. - Geographic Information Systems - A system for collecting and mapping data in a geographic format GLONASS - (GLObal Navigation Satellite System) - A constellation of satellites maintained by the Russian Government for high accuracy 3 dimensional positioning . Plan: an existing document that describes the purpose for, and details of creating and using a geographic information system. allows you to view your data on maps then analyze the data based on geography. This page is created as a service to the visitors and customers of Able Software website. Web sites listed on this page are not related to Able Software if not explicitly indicated and is for information only. for What Its Worth by Larry Daniel Looking and Thinking Beyond the Department by Larry Daniel The Global Positioning System (GPS) by Peter H. Dana -- A widely-used overview of GPS. stores information about the world as a collection of thematic layers that can be linked together by geography. , it is important to view these elements as a continuing process. Figs. 17.3 and 17. Cookbook: Glossary Address matching - Address matching is the process of assigning x, y coordinates to addresses so they can be displayed as points on a map. This process allows two or more data files to be related using a common address field. Attribute - A trait or characteristic of a feature on a map. and the Geoweb 2: Terminology The following is a non-alphabetised glossary I wrote today for GG3090 class, prompted by a suggestion from a student. It is an evolving document open to suggestions (the definition of 'map' might be contentious). , growing at 35% per year ESRI of Redlands, CA, developers of ARC/INFO, had 350 employees and sales of$40 million in 1988 and a reported 42% increase in sales in 1989 .

data layer in raster format (cell-based representation)
Image
A graphic representation of a real world object or area.Images can include aerial imagery, satellite data and photographs.

قائمة المصطلحات
History of the County Engineer
Permits / Standards
Building In Rural Auglaize County?

is used around the world in academic and commercial settings as well as by many governmental agencies and environmental consulting companies. It runs on a variety of popular hardware platforms and is Free open-source software released under the terms of the GNU General Public License.

) instance.

, and its true location in the real world.

symbols from layer library
Share .

Terms
A, B, C, D, E, F, G, H, I, J, K, L, M, N, O, P, Q, R, S, T, U, V, W, X, Y, Z.

feature class or object table with a schematic feature class .

product created at a variety of scales. HTML: HyperText Markup Language: A Hypertext document format used on the World-Wide Web. Built on top of SGML (Standard Generalized Markup Language).

Beyond the Basics (GPS and

) Part 1
IN WHICH you learn (a) how to collect attribute information about the environment simultaneously with collecting GPS position data, (b) how to plan for important GPS missions, (c) about differential correction that takes place immediately, .

A geographic information system (

) captures, stores, analyzes, manages, and presents data that is linked to location.

Geographic Information System,

مجموعة منظمة من أجهزة الكمبيوتر والبرامج والبيانات الجغرافية والموظفين المصممة لالتقاط وتخزين وتحديث ومعالجة وتحليل وعرض جميع أشكال المعلومات المرجعية جغرافيًا بكفاءة.

functions at a pixel-level precision, since lat/long coordinates tend to be very specific. A 800 600 image could by no means ensure that your control points (see step 3) are precise enough. If you scan your image yourself, make sure that you select the highest resolution available.

Slides and Images from Papers by
Keith C. Clarke & Karen A. Mulcahy
ل

/LIS 95 in Nashville, TN
Distortion on the Interrupted Modified Collignon Projection .

because many spatial modeling operations don't require coordinates, only topological information. على سبيل المثال ، يتطلب العثور على المسار الأمثل بين نقطتين قائمة بالأقواس التي تتصل ببعضها البعض وتكلفة اجتياز كل قوس في كل اتجاه.

(Geographic Information Systems) - An integrated collection of computer software and data used to view and manage information about geographic places, analyze spatial relationships (how far between), and model spatial processes.

data conversion transforms data from its current format (usually paper maps or related sources) into a digital format. In some cases, the data is already in a digital format, but often this data is not compatible with the current system.

) is not one thing, nor a single analysis but rather a collection of hardware, software, data, organizations, and professionals that together help people represent and analyze geographic data.

is all of the above-and more." .

(Geographic Information Systems) in Everyday Life
Learn the Dozens of Sub-Disciplines of Geography
The Mediterranean Sea - Geographic Information .

See Geographic Information System.
Global Positioning System (GPS)
A global navigation system based on 24 or more satellites orbiting the earth at an altitude of 12,000 statue miles and providing very precise, worldwide positioning and navigation information 24 hours a day, in any weather.

through history
35,000 years ago, on the walls of caves near Lascaux, France, Cro-Magnon hunters drew pictures of the animals they hunted. Associated with the animal drawings are track lines and tallies thought to depict migration routes.

رسم الخرائط
There are other maps that many of us are exposed to. In newspapers and news magazines, on some TV shows, and especially in places like the National Geographic magazine and website we may see maps that show more than just the normal physical and political information.

Terms
Area - The size of a two dimensional feature. The shape can be a fully closed polygon, or set of contiguous raster cells. [1]
Attributes - Non-spatial characteristics of a particular feature or raster cell typically stored in a table. [1] .

البرمجيات
Geographic information can be accessed, transferred, transformed, overlaid, processed and displayed using numerous software applications. Within industry commercial offerings from companies such as ESRI and Mapinfo dominate, offering an entire suite of tools.

allows for more efficient, and often more cost-effective ways of manipulating, analyzing and display spatial data.

as including the procedures, operating personnel, and spatial data that go into the system.
792 .

(geographic information systems) is the hardware, software, data, personnel systems, etc., involved with geographical coordinate data.

Geographic(al) information system(s) Geohydrologic Information System Geoscience Information Society Global Indexing System
GISDEX .

GCM
General circulation model Global climate model General Command of Mapping (Turkey) .

assembles information from a several of sources, including ground surveys, existing maps, aerial photos, and satellite imagery.

can do this because it has the ability to link spatial data with information (facts and figures) about a particular feature on a map. The information is stored as attributes, or characteristics, of the graphically represented feature.

technology focused on the specific segment facility information application and management, such as roads, pipes, and wires.
Axis
A reference line in a coordinate system.

components from different vendors, rather than being limited to one product.

data does not need a full dynamic type system with associations, operations, multiple values. With this in mind we have a "simple" extension of Feature and FeatureType providing to represent this kind of information.

and to coordinate the use of common specifications and standards to achieve such a goal.
.

users are mostly confronted in their work with transformations from one two-dimensional coordinate system to another. htm '، 0)

VirtualGIS displays orthorectified aerial images (or other overlays) in conjunction with a DEM of the same area. Click VirtualGIS on the main ERDAS tool bar and choose the viewer. First open a suitable DEM and then overlay with geocorrected or orthorectified images.

" (version 3.0 - 09/96 release date)
Capabilities & Limitations of ArcView 2.1: .

data model represents the world by sub-dividing features on the earth's surface according to a specific theme. Each theme is georeferenced. Examples of layers for a study area might include: roads, railways, urban areas, coal mines and so on.

؟ What type of activities are carried out on these computerized systems? Describe the difference between element and attribute data.

geographic information system (

)-A data-handling and analysis system based on sets of data distributed spatially in two dimensions.

Subject: Geographic Information Systems Geographic information systems (

) technology can be used for scientific investigations, resource management, and development planning.

## 5. Conclusion

Wide access to microdata is beneficial for advancement of research and evidence-based policy but it is often constrained by confidentiality concerns. Office for National Statistics (ONS) has explored synthetic data techniques to allow for the release of high-quality microdata without compromising confidentiality. This pilot project has delivered some user guidance for generating synthetic data, review of available software for generating synthetic data, and a detailed description of data synthesising for a specific use case. Our work also highlighted the limitations and challenges in the process of creating synthetic data.

Continued research in these areas will help to increase the quality and acceptance of using synthetic data for disclosure control and for research purposes. The next step of the research is to extend the guidance to cover more available tools and use cases. In addition, an extension of the prototype synthetic Labour Force Survey (LFS) dataset to include all characteristics for public usage is desirable.

## خلفية

Predictive data analytics becomes increasingly important for organizations and enable them to remain competitive and agile in continuously changing markets (Constantiou and Kallinikos 2015 Gillon et al. 2012 Mithas et al. 2013 Sharma et al. 2014). This holds especially for energy utilities that are exposed to a groundbreaking market transition, affecting them from the production and sales perspective. على ال energy production side, the current fossil-nuclear energy supply is currently being replaced by renewable energy sources (Dangerman and Schellnhuber 2013), which forces utility companies to high investments into their fixed assets. على ال energy retail side, their market becomes more competitive due to market liberalizations in many countries and the fact that private spendings for energy are not much increasing, since the share of wallet for housing, water and energy remains nearly constant during the last 20 years in Europe at 20–25% (Eurostat 2017). Business model innovations in the utility industry are therefore crucial (Markard and Truffer 2006).

### Big data analytics in the energy industry

Utility companies hold, however, millions of data points on their customers that can be developed to a valuable business asset. This available data will further increase in the future due to the roll-out of smart meter and Internet of things infrastructures. Techniques of big data analytics, especially predictive information systems will help utility companies to make sense of that data (Sharma et al. 2014 Zhou et al. 2016) and can enable them to create innovative products and services. Even though, first steps in development of algorithms and tools for predictive energy data analytics are done and basic knowledge on how to create insights from big data exists, but the currently existing models are often not reliable enough to be used in practice. Therefore, further research on better predictor variables, more suitable data processing and knowledge modeling techniques is necessary. This work contributes to this research gap and investigates the use of freely available geographic data for predictive energy data analytics in the specific but relevant example of household classification.

### Predictive analytics in energy retail: the use of household classification

A possible reaction to the harsher market requirements for energy retailer is to improve the customer communication and to offer product or services that better fit to the needs of their customers (Gebauer et al. 2014), establish targeted customer communication or one-to-one marketing. Examples for such products are tariffs for specific customer groups, energy consulting, and energy- or infrastructure-related cross-sales (e.g., heating and cooling appliances, photovoltaic installations, Internet access). For the development and commercialization of such products and services, detailed knowledge about customers is necessary. Typical variables needed in marketing campaigns are household characteristics (e.g., families with children, household type and size) or knowledge on the customers’ attitudes and intentions (e.g., towards sustainability, purchase intentions for products). Recent studies have shown, that various household characteristics (such as household type, type of the heating system, number of residents, etc.) can be identified using 30-min electricity smart meter data (Beckel et al. 2014). Based on 15-min smart meter and hourly weather data, household characteristics related to energy-efficiency can be identified (Sodenkamp et al. 2017 Hopf et al. 2018). Other studies show that households with old heating systems can be identified to be addressed in an energy-efficiency campaign (Kozlovskiy et al. 2016), or customers using an electric vehicle (Verma et al. 2015), which is also an interesting insight for energy utilities. In all studies on household classification, several attempts have been made to improve the quality of predictive artifacts. Multiple data preparation and machine learning algorithms have been tested so far, but the models still need further improvements and lowered error rates to become more reliable and ready for real applications in the industry. I argue that additional predictor variables need to be taken into account to increase the quality of household classification models, since the information that is possible to extract from electricity consumption data is limited. In this paper, I therefore present VGI as a promising source of additional data that is freely available online and has emerged in the past years.

### Volunteered geographic information as a data source for predictive analytics

A significant number of web portals arose during the past years, due to the fact that users collaborate and create crowd-sourced data that often has a geographic reference associated. Goodchild (2007) coined the term VGI for this phenomenon of user-generated geospatial data. His work attracted a considerable amount of research in the past ten years and lead also to attention in other disciplines than geography. Unique features of this data source are the free availability and the variety of subjects – even for some subjects, data was never-collected before (Sester et al. 2014).

In this work, all user-generated geospatial data is considered as VGI as long as it was collected with the (explicit or implicit) consent of the user. This definition does not include data provided or published in a non-voluntary way (e.g., accidentally published or revealed by hackers).

This definition is necessary here, since there is no clear consensus in related works on the concept of VGI. On the one hand, there is the understanding of VGI in a strict sense, restricting it to user contributions that are made “with the intent of providing information about the geographic world” (Elwood et al. 2012). Examples for this interpretation of VGI are the co-creation of maps (e.g., OpenStreetMap, Wikimapia) or the collection of environmental data (e.g., Christmas Bird Count). On the other hand, user contributions without the intrinsic motivation to publish geographic data exist, since users create for tweets, posts, likes, reviews, photos or other content that has a spatial datum. Stefanidis et al. (2013) name such information Ambient Geospatial Information (AGI), but they are seen as VGI in a broader sense in this paper. Harvey (2013) suggests to delimit the term VGI to data that was collected with a clear opt-in of users. He suggests the term Contributed Geographic Information (CGI) for all geographic data that was collected without that clear consent, but having an opt-out possibility for users as. Harvey names “cell phone tracking and RFID-equipped transport cards” as examples, but the use of such data, outside the objective it was collected for, stays obviously often in conflict with privacy or data protection regulations. Therefore, the above given definition of VGI in contrast to non-voluntary generated data is preferred here.

A vast number of VGI initiatives are already documented in the literature: (Elwood et al. 2012) mention 99 initiatives that they found in 2009 and categorize them according to geographic extend, the date initiated, the sponsoring entity and the primary purpose of the initiative. Ballatore et al. (2013), Sester et al. (2014), such as Rinner and Fast (2015) document further platforms and suggest different categorization schemes for initiatives, by focusing on the usage of VGI data, the data types and formats used. Due the dependence on continuous contributions from users, a large turnover of newly emerging, changing and perishing projects is visible. Based on the existing collections (Elwood et al. 2012 See et al. 2016), I collected 116 VGI initiatives that have been documented in the literature and analyzed them together with students. The list was further extended with a number of real estate advertisement portals where users can search for hiring, renting, selling or buying houses and dwellings. In total, we identified a sample of 127 initiatives. This collection is not intended to be an extensive list of VGI initiatives, but to give some idea of the types and categories of such data sources. From the 116 VGI initiatives that stem from the literature, only 64 (53.7%) still have an active web site or could be found via the Internet Footnote 1 . However, some initiatives have become very popular and attracted many active users (such as OSM, or Geocaching).

By looking at the distribution of active initiatives according to data types (Rinner and Fast 2015) and categories (Sester et al. 2014) in Fig. 1, one can see that the majority of projects deal with location data, mapping, or environmental and social media topics. The category “business” is also frequent, but this figure is misleading, since ten German-speaking real estate portals were assigned to this category that might over-represent this category in comparison to others. Generally, VGI initiatives contain a considerable amount of data that is related to an energy context and is therefore relevant for the utility industry, given that knowledge from the freely available data sources can be derived. However, the mining of such data sources is associated with large effort to access the data. For example, only 26 of 75 active platforms have an explicit API for data access.

Frequencies of ن=75 active VGI initiatives 2017, according to data types (Rinner and Fast 2015) and categories (Sester et al. 2014) some portals have multiple data types and categories associated

No question, The Internet of Things (IoT) is the Next Big Thing. Gartner estimates that there will be 26 billion IoT-connected devices by 2020, producing incredible amounts of data on a second-by-second basis. This will dwarf the estimated 7.3 billion traditional computing devices – PCs, tablets, smartphones – expected to be online by 2020.

This trove of data presents tremendous opportunities for those prepared to use it. The question is, how can governments perform meaningful analysis and produce actionable information from this data in a way that will benefit citizens? Much of the effort in IoT today has focused on managing the end devices that produce data. But the Internet of Things is not about the sensors it’s about the data the sensors produce.

Link analysis already is already helping us understand the relations between a person of interest and other people, places, and things. Police Departments already use Geographic Information Systems to identify high-crime areas and put “cops on the dots.” But what if we could correlate historical weather data with crime statistics and sentiment analysis to predict when and where certain kinds of activity can be expected? Smart meters can track household energy usage what if this data could be used to identify vacant homes that are at risk for vandalism and arson? Traffic light data already is used to understand traffic patterns what if this data could be combined with public event calendars and social media to anticipate traffic problems on a given day, time, and location?

The big challenges of using Big Data effectively are visibility and scale. First, making the data visible so that it can be used requires knowing what data is being generated, who owns it and where it resides, and what format it is in. Beginning with this, data scientists can normalize data and do the correlation and analysis to provide relationships for users. But gaining visibility is not necessarily a simple task – data resides not only in separate systems and silos, but is controlled by different political and administrative entities. Data on energy usage belongs to utilities, which can be either public or private, and traffic information belongs to the traffic department. Both of these could be useful to police, but police departments will have to cross administrative boundaries to access it.

Second, the sheer scale of the data involved can be daunting. Sensors can produce millions samples per second, demanding huge storage capacity. Storage demands can be compounded by the need to maintain historical data. Real-time or near-real-time analysis can be valuable, but value grows as historical data is used to identify and project trends.

To take advantage of the opportunities offered by the IoT to improve citizen services, agencies will have to have the storage and computing capacity to manage Big Data from multiple sources and produce actionable analysis. There are three important steps in enabling your city, department or agency to do this:

• Understand what data is available and what you want to do with it. This will include data from your own sensors and systems, but can also include that from other departments and organizations. It also can include open source data that can be culled from social networks that can provide information on public sentiment and activities.
• Develop a scalable platform for storage and analysis. Not all of the data you are using will be under your stewardship, and it is unlikely to be in one place. This requires not only storage capacity, but also a system to access and correlate data from disparate sources and in different formats. Cloud services can be a good choice for setting up this platform, providing the scalability, flexibility and economy to take advantage of data in innovative ways.
• Determine what you are providing to citizens in exchange for access to the data. The ultimate goal should be to provide value to citizens, and this is all the more important when you are using citizen managed data, such as that from smart metering and social media. There is a cultural and generational shift occurring in which “digital natives” are increasingly comfortable with sharing information, but willingness to share ultimately will depend on the value proposition being offered.

When everything is connected, it means that everything-no matter how insignificant-will become a source of data. Seemingly unrelated information ranging from temperatures and traffic lights to energy usage and generation of garbage could reveal previously unseen relationships that can drive improved citizen services and better public safety. As governments work toward better understanding, utilizing, and exploring these data resources, they move toward a more connected and protected society.

## Footnotes

1 The NHGIS includes an extraordinary body of statistical information and documentation, including approximately 3 terabytes of statistical data accompanied by 5 million lines of XML-encoded codebooks, 100 gigabytes of indices to the data, and more than 200,000 polygons describing historical census geography.

2 Boundary files for states/territories and counties are available for the entire time series of 1790 to the present. Census-tract boundary files are available from 1910 onward. The NHGIS also provides electronic high-quality boundary files for other units of census geography, such as congressional districts, zip code tabulation areas, voting districts, trust land, standard consolidated statistical areas, places, minor civil divisions, county subdivisions, blocks, and block groups. For the 1990 and 2000 censuses, specialized geography boundary files are provided for American Indian areas, Alaska native areas, and Hawaiian homelands. For metropolitan areas, boundary files are available for urbanized areas, New England county metropolitan areas, and𠅏or the period 1950�, metropolitan statistical areas (called “standard metropolitan statistical areas” in pre-1950 data).

3 In the case of 1960 census and American Community Survey, conversion of the data to NHGIS format will be supported by other grants, NIHHD041575 and NSF BCS-0648005, respectively.

4 The necessary data in this instance would include an aggregate file with school attendance data by single years of age paired with a microdata file from the same census that identifies PUMAs. Although such data do not currently exist, we could potentially construct them for 1960 as part of the census recovery project.

6 The IPUMS project (Perlmann 2003) has already compiled most of these materials and is now converting them to marked-up structured documents that make machine-processing comparatively easy. We plan to make this part of the metadata system fully interoperable between the two projects, so we can create and maintain a single set of documents that will serve both the microdata and aggregate data series.