أكثر

خطأ في بناء جملة ArcGIS Python باستخدام المتداخلة إذا كان الأمر كذلك


أحاول استخدام الآلة الحاسبة للحقل في ArcMap 10.2 لملء حقل فارغ بناءً على محتويات حقلين خارجين باستخدام نص Python النصي هذا في كود البرنامج النصي Pre-Logic.

def myfunc (legend، biltype): if (legend == '0000 Manmade Surface or step'): إرجاع 'Manmade Surface or step' elif (legend == '0000 متعدد الأسطح (حديقة)'): إرجاع 'Garden' elif ( أسطورة == '0000 Natural Surface'): إرجاع 'Natural Surface' elif (أسطورة == '0000 Path'): إرجاع 'Path' elif (legend == '0000 Railway'): إرجاع 'Railway' elif (أسطورة == '0000 Road'): إرجاع 'Road' elif (legend == '0000 Road Traffic calming'): إرجاع 'Road Traffic Calming' elif (legend == '0000 Structure'): إرجاع 'Structure' elif (legend == ' 0000 Track '): إرجاع' Track 'elif (legend ==' 0000 Unclassified (or broken) '): إرجاع' Unclassified (or broken) 'elif (legend ==' 0000 Unknown Surface '): إرجاع' Unknown Surface 'elif (legend == '0321 Archway'): إرجاع 'Archway' elif (legend == '0323 Glasshouse'): إرجاع 'Glasshouse' elif (legend == '0377 Boulders'): إرجاع 'Boulders' elif (legend == ' 0379 الأشجار الصنوبرية '): إرجاع "الأشجار الصنوبرية" elif (أسطورة ==' 0380 الصنوبرية - مبعثرة '): إرجاع "الصنوبرية - مبعثرة" elif ( أسطورة == '0382 Marsh reeds or saltmarsh'): إرجاع "قصب Marsh أو salmarsh" elif (أسطورة == '0384 أشجار غير صخرية): إرجاع "الأشجار غير الصخرية" elif (legend ==' 0385 Nonconiferous - spattered '): return 'Nonconiferous - scattered' elif (legend == '0386 Orchard'): إرجاع 'Orchard' elif (legend == '0390 Rough grassland'): إرجاع 'Rough grassland' elif (legend == '0392 Scrub'): return ' فرك 'elif (legend ==' 0395 اتصال المستوى العلوي '): إرجاع' اتصال المستوى العلوي 'elif (أسطورة ==' 0400 المياه الداخلية '): إرجاع' المياه الداخلية 'elif (أسطورة ==' 0321 مبنى '): إذا (biltype.startswith ("Commercial، Education"): إرجاع "Education" elif (biltype.startswith ("Commercial، Emergency and Rescue Service"): إرجاع "خدمات الطوارئ" elif (biltype.startswith ("تجاري ، بيع بالتجزئة"): إرجاع "التجزئة" elif (biltype.startswith ("سكني"): إرجاع "سكني" elif (biltype.startswith ("تجاري ، صناعي"): إرجاع "الصناعية" elif (biltype.startswith ("تجاري ، فنادق"): إرجاع "الفنادق" إليف (ب iltype.startswith ("تجاري ، خدمات مجتمعية"): إرجاع "خدمات المجتمع" elif (biltype.startswith ("تجاري ، طبي"): إرجاع "Medical" elif (biltype.startswith ("تجاري ، وقت فراغ"): عودة "وقت فراغ 'elif (biltype.startswith (' Commercial، Office '): إرجاع "المكاتب" elif (biltype.startswith ("Commercial، Utilities"): إرجاع "Utilities" else: إرجاع "Building - Other" else: إرجاع "خطأ"

ثم ضبط الحقل على المساواة

myfunc (! LEGEND !،! blpu_class!)

حيث LEGEND ، و blpu_class كحقلين مع بيانات المصدر.

عندما أقوم بتشغيل الآلة الحاسبة للحقل ، أحصل على خطأ في بناء جملة Python 000989: خطأ في التحليل خطأ Syntax: بناء جملة غير صالح (السطر 51)

هذه هي بداية if المتداخلة ، لكن لا يمكنني معرفة ماهية المشكلة.


الكود الخاص بك على ما يرام ولكنك تفتقد قوسًا صحيحًا لكل سطر من التعليمات البرمجية في الجزء المتداخل إذا كان:

if (biltype.startswith ('Commercial، Education')): إرجاع 'Education' elif (biltype.startswith ('Commercial، Emergency and Rescue Service')): قم بإرجاع 'خدمات الطوارئ' elif (biltype.startswith ('Commercial، Retail) ')): إرجاع "التجزئة" elif (biltype.startswith ("سكني")): إرجاع "سكني" elif (biltype.startswith ("تجاري ، صناعي")): إرجاع "الصناعية" elif (biltype.startswith ("تجاري ، Hotels ')): إرجاع "Hotels" elif (biltype.startswith ("Commercial، Community Services")): إرجاع "Community Services" elif (biltype.startswith ("Commercial، Medical")): إرجاع "Medical" elif ( biltype.startswith ("Commercial، Leisure")): إرجاع "Leisure" elif (biltype.startswith ("Commercial، Office")): إرجاع "المكاتب" elif (biltype.startswith ("Commercial، Utilities")): return " خدمات'

بناء التعبيرات في حاسبة البيانات النقطية

عند إنشاء تعبيرات في أداة الحاسبة النقطية ، فإن النقر والنقر المزدوج فوق الطبقات والمتغيرات والأزرار وأسماء الأدوات المختلفة المتوفرة في مربع الحوار سيساعدك على تجنب أخطاء بناء الجملة التي قد تحدث أثناء الكتابة.

نظرًا لأن التعبير الذي تم إدخاله في أداة Raster Calculator سيتم تنفيذه في Python ، و Python حساسة لحالة الأحرف ، فمن المهم استخدام الأحرف الكبيرة الصحيحة لاسم الأداة. على سبيل المثال ، لاستخدام أداة IsNull ، تأكد من كتابتها كـ IsNull ، بدلاً من Isnull أو isnull.

عند استخدام عدة عوامل علائقية أو منطقية في تسلسل ، يتطلب التعبير أقواسًا. لمزيد من المعلومات ، راجع إرشادات الاستخدام المدرجة في تعليمات أداة حاسبة البيانات النقطية.


بمجرد تنظيف علامات التبويب والمسافات (يجب أن يكون لديك علامات تبويب فقط أو مسافات فقط) ، ستحتاج إلى إصلاح حلقاتك:

وإلا فسيكون لديك خطأ في الفهرس.

SilentGhost صحيح - على عكس لغات مثل Javascript ، عندما تكتب

ثم لم يتم تعيين j لـ 0 و 1 و 2 - يتم تعيين القيم الفعلية 30 و 40 و 50. لذلك لا داعي للقول ، في سطر آخر ،

في الواقع ، إذا قمت بذلك ، في المرة الأولى من خلال الحلقة ، فسيتم تقييمها كـ

وهو ما يعد بعيدًا عن حدود قائمة من ثلاثة عناصر ، وستحصل على خطأ في الفهرس.

إذا كنت تريد حقًا أن تفعل ذلك بالطريقة الأخرى - إذا كنت تريد ذلك حقا كنت بحاجة إلى الفهارس وكذلك القيم ، يمكنك القيام بشيء مثل هذا:

يمنحك len (s) طول s (3 ، في هذه الحالة) ، وتقوم دالة النطاق بإنشاء قائمة جديدة لك ، النطاق (n) يحتوي على الأعداد الصحيحة من 0 إلى n-1. في هذه الحالة ، يعرض النطاق (3) [0 ، 1 ، 2]

كما يشير SilentGhost في التعليقات ، هذا أكثر بيثونية:

يُرجع التعداد (en) الأزواج الثلاثة (0 ، 30) ، (1 ، 40) ، (2 ، 50) ، بهذا الترتيب. مع ذلك ، لديك الفهارس في s ، وكذلك العنصر الفعلي ، في نفس الوقت.


10 أخطاء شائعة في لغة Python لبدء مبرمجي ArcGIS

على مر السنين ، قمت بتدريس المئات من مبرمجي Python من المستوى المبتدئ كيفية أتمتة مهام المعالجة الجغرافية ArcGIS الخاصة بهم. وغني عن القول أنني رأيت كل أنواع الأخطاء. لكن هناك بعض الأخطاء الشائعة التي أراها مرارًا وتكرارًا. لذا ، إذا كنت مبرمجًا بلغة Python على مستوى المبتدئين وتعمل مع ArcGIS ، نأمل أن يساعدك هذا في تجاوز الحدبة. ستجد أدناه قائمة الأخطاء العشرة الأكثر شيوعًا بدون ترتيب معين.

1. الأخطاء المطبعية - ربما يجب أن يستمر هذا دون أن يقول ذلك ، لكن الأخطاء المطبعية هي الخطأ الأكثر شيوعًا وثباتًا. عندما تحصل على خطأ في التعليمات البرمجية الخاصة بك ، فمن المحتمل أن يكون هذا هو أول شيء تتحقق منه. تأكد من أنه عندما تشير إلى متغير في مكان ما في شفرتك ، فإن اسم المتغير الذي تشير إليه مكتوب تمامًا كما حددت اسم المتغير سابقًا. هذا مثال:

layerParcel = "شوارع"
….. #الشفرة
….. #الشفرة
….. #الشفرة
if lyerParcel == "Streets": # لاحظ أنني تركت الحرف "a" في layerParcel

2. لغة بايثون حساسة لحالة الأحرف - ربما يكون هذا هو الخطأ غير المطبعي الأكثر شيوعًا الذي صادفته عند تعليم Python لمبرمجي المستوى المبتدئ. هذا يعني على سبيل المثال أن مترجم بايثون سيرى ما يلي كمتغيرات مختلفة تمامًا.

ليس من غير المألوف أن نرى المبرمجين الجدد يعرّفون متغيرًا بمزيج بديل من الغلاف (MapSize) ولكن بعد ذلك يحاولون لاحقًا الإشارة إلى المتغير باستخدام مزيج مختلف من الحالة (تعيين الخرائط) مما يؤدي إلى حدوث خطأ.

3. المسافة البادئة - تستخدم بايثون المسافة البادئة على نطاق واسع. لا تحتوي وظائف Python على بداية أو نهاية صريحة ، ولا توجد أقواس معقوفة لتحديد مكان بدء وتوقف رمز الوظيفة. المحدد الوحيد هو النقطتان (:) والمسافة البادئة للشفرة نفسها. انظر المثال أدناه:

استيراد arcpy
mxd = mapping.MapDocument (“CURRENT”)
لـ df في التعيين.
لير في رسم الخرائط.
إذا كان lyr.name == "مناطق المدارس":
إزالة طبقة (df ، lyr)

يتم تعريف كتل التعليمات البرمجية من خلال المسافة البادئة الخاصة بهم. من خلال "كتلة التعليمات البرمجية" ، أعني الدوال ، عبارات if ، والحلقات for ، والحلقات while loops ، وما إلى ذلك. تبدأ المسافة البادئة في إنشاء كتلة وتنهيها إزالة المسافة البادئة. لا توجد أقواس أو أقواس أو كلمات رئيسية صريحة. هذا يعني أن المسافة البيضاء في هذه الحالة مهمة (عادةً ليست في Python ولكن عندما يتعلق الأمر بمسافة بادئة لكتل ​​التعليمات البرمجية فهي كذلك) ، ويجب أن تكون متسقة. لست مضطرًا لتضمين أي عدد معين من المسافات ، يجب أن تكون متسقة فقط.

يجب أيضًا تجنب خلط علامات التبويب والمسافات في المسافة البادئة لكتلة واحدة معينة. بخلاف ذلك ، ما تراه في المحرر الخاص بك قد لا يكون ما تراه Python عندما تحسب علامات التبويب على أنها عدد من المسافات. من الأكثر أمانًا استخدام جميع علامات التبويب أو جميع المسافات لكل كتلة. عدد المساحات متروك لك.

4. تذكر تضمين النقطتين للعبارات المركبة - هذا خطأ شائع جدًا في الترميز للمبتدئين: لا تنس كتابة a: في نهاية رؤوس العبارات المركبة (السطر الأول من if ، while ، for ، try ، with). أود أن أقول إن غالبية طلابي يرتكبون هذا الخطأ مرة واحدة على الأقل وعادةً مرات عديدة خلال التدريب. أعتقد أن هذا يرجع جزئيًا إلى أنهم ببساطة ليس لديهم فهم كامل لما يمثله هذا القولون وهو أنه يحدد بداية كتلة التعليمات البرمجية.

5. يجب أن تبدأ أسماء المتغيرات بحرف أو شرطة سفلية - يجب أن تبدأ المتغيرات بحرف أو شرطة سفلية. لا تبدأ اسم متغير برقم أو بأي حرف خاص آخر. أيضًا ، هناك كلمات معينة محجوزة ولا يمكن استخدامها كأسماء متغيرات بما في ذلك ما يلي:

و ، تأكيد ، كسر ، فئة ، متابعة ، def ، del ، elif ، وإلا ، باستثناء ، exec ، أخيرًا ، من ، عالمي ، إذا ، استيراد ، في ، هو ، لامدا ، لا ، أو تمرير ، طباعة ، رفع ، العودة ، حاول ، بينما ، العائد

6. تهيئة المتغيرات - في Python ، لا يمكنك استخدام اسم متغير داخل تعبير حتى يتم تعيين قيمة له. هذا عن قصد: فهو يساعد على منع الأخطاء المطبعية الشائعة ، ويتجنب السؤال الغامض حول ما يجب أن يكون التقصير التلقائي (0 ، لا شيء ، "" ، [] ،؟). تذكر تهيئة العدادات على 0 ، وسرد المجمعات إلى [] ، وهكذا.

7. التمديدات التلقائية في النوافذ - إذا كنت تقوم بالترميز في شيء أساسي حقًا مثل Notepad ، فتأكد من إعطاء ملفك لاحقة .py بشكل صريح عند الحفظ. وإلا فسيتم حفظ ملفك بامتداد .txt ، مما يجعل من الصعب تشغيله في بعض أنظمة التشغيل. يضيف كل من MS Word و Wordpad أيضًا أحرف تنسيق بشكل افتراضي ليست عبارة عن بناء جملة Python قانوني. يجب عليك دائمًا اختيار All Files عند الحفظ والحفظ كنص بسيط على Windows ، أو استخدام برامج تحرير أكثر ملاءمة للمبرمجين مثل IDLE. ومع ذلك ، إذا كنت تستخدم IDLE ، فهناك مشكلة مع هذا المحرر أيضًا. عليك أن تتذكر كتابة ملحق الملف .py عند الحفظ. لسبب ما ، لن يقوم تلقائيًا بإضافة ملحق .py.

8. المزيد من قواعد المسافة البادئة - تأكد من بدء تشغيل التعليمات البرمجية ذات المستوى الأعلى غير المتداخلة على طول الطريق إلى اليسار. يجب ألا تكون هناك مسافة على يسار السطر الأول من الشفرة. ولا حتى مسافة واحدة. كما ذكرت أعلاه ، تستخدم Python المسافة البادئة لتحديد كتل التعليمات البرمجية المتداخلة ، لذا فإن المسافة البيضاء على يسار الكود الخاص بك تعني كتلة متداخلة. يتم تجاهل المساحة البيضاء بشكل عام في كل مكان ، باستثناء المسافة البادئة. لقد رأيت الطلاب يضيفون مسافة واحدة إلى التعليمات البرمجية غير المتداخلة ذات المستوى الأعلى مرات أكثر مما يمكنني الاعتماد عليه. لست متأكدًا من سبب ذلك ولكنه يحدث.

9. استخدم الأقواس لاستدعاء وظيفة - يجب إضافة أقواس بعد اسم الوظيفة لاستدعائها ، سواء كانت تأخذ وسيطات أم لا. قد يكون استدعاء الوظيفة المناسبة append () وليس إلحاقًا. على الرغم من أن append () في هذه الحالة لا يحتاج إلى أي معامِلات للتنفيذ ، فإنك تحتاج إلى تضمين الأقواس لتنفيذ الوظيفة.

10. لا تستخدم شرطة مائلة للخلف واحدة عند الإشارة إلى المسارات إلى مجموعات البيانات - تعد الشرطة المائلة العكسية المفردة في Python شخصية هروب. على سبيل المثال ، ترى Python n كخط تغذية و t كعلامة تبويب. لذلك ، سيؤدي تمثيل مسار لمجموعة بيانات كـ c: data myshapefile.shp إلى حدوث خطأ. لديك عدة خيارات لحل هذا. أسهل طريقة للتعامل مع هذه المشكلة هي تضمين حرف صغير "r" قبل المسار كما في r ”c: data myshapefile.shp”. يمكنك أيضًا استخدام شرطتين مائلتين عكسيتين "c: data myshapefile.shp" أو شرطة مائلة واحدة للأمام "c: /data/myshapefile.shp".

هل تريد معرفة المزيد حول كيفية استخدام Python لأتمتة مهام المعالجة الجغرافية الخاصة بك؟ تحقق من [Geospatial Training Services & # 39] برمجة ArcGIS مع ورش عمل Python.

أعيد طبعها بإذن من GeoChalkboard ، مدونة خدمات تدريب GeoSpatial.


مشاريع المساعدة الفنية المحلية (LTA)

اهداف الدورة
1.عرض البيانات الجغرافية في ArcMap
2- استخدم أدوات التحليل لإنشاء بيانات جديدة
3- تطبيق مقاربة معيارية لحل المشاكل الجغرافية
4- افهم الأنواع المختلفة من العلاقات المكانية بين ميزات العالم الحقيقي.
5. الاستعلام عن قاعدة بيانات GIS للحصول على المعلومات وتحديد الميزات.

بدء استخدام GIS (لـ ArcGIS 9.2-9.3)

توفر هذه الدورة التدريبية أساسًا لفهم ماهية نظام المعلومات الجغرافية والإمكانيات التي يوفرها لاكتشاف الأنماط والعلاقات والاتجاهات. لقد تعلمت كيف تختلف خرائط GIS عن الأنواع الأخرى من الخرائط الورقية والرقمية ، وما الذي يجعل البيانات المستخدمة في نظام المعلومات الجغرافية فريدة من نوعها ، وكيفية استخدام برنامج GIS للحصول على المعلومات وإنشاء خرائط ذات معنى.

اهداف الدورة
1. عرض البيانات على خريطة نظم المعلومات الجغرافية
2- استعلم عن قاعدة بيانات GIS للحصول على المعلومات وتحديد المعالم على الخريطة
3- فهم الأنواع المختلفة من العلاقات المكانية بين ميزات العالم الحقيقي
4- استخدم أدوات التحليل لإنشاء بيانات جديدة
5- تطبيق مقاربة معيارية لحل المشاكل الجغرافية

بدء استخدام GIS (لـ ArcGIS 10.1)

ساعدتني هذه الدورة على فهم ماهية نظام المعلومات الجغرافية ولماذا تعتمد المنظمات في جميع أنحاء العالم على تقنية نظم المعلومات الجغرافية. في تمارين وأنشطة الدورة التدريبية ، عملت مع برنامج ArcGIS ورأيت كيف يدعم GIS حل المشكلات في العديد من السياقات المختلفة.

اهداف الدورة
1- زيادة الإنتاجية باستخدام ميزات ArcMap الجديدة ، بما في ذلك نافذة الكتالوج المضمنة والبحث عن الرموز وطبقات خريطة الأساس
2- دمج إمكانات رسم الخرائط المحسّنة في خرائطك ، مثل نص التخطيط الديناميكي والصفحات المعتمدة على البيانات لإنشاء سلسلة خرائط والوصول إلى خرائط الأساس المصممة بشكل احترافي

استخدام ArcMap في ArcGIS Desktop 10

يجلب ArcGIS 10 العديد من التحسينات إلى ArcMap التي تساعدك على إنتاج خرائط أفضل ومشاركتها بشكل أسرع. في هذه الدورة ، تعرفت على الميزات الجديدة الرئيسية التي تم تصميمها لتقليل الوقت المستغرق في مهام رسم الخرائط الشائعة وتحسين جودة منتجات الخرائط الخاصة بي. تعلمت في العرض التقديمي كيف يمكنني الاستفادة من هذه الميزات الجديدة لتحسين سير العمل اليومي.

اهداف الدورة
1. تحرير مع قوالب الميزات
2. العمل ضمن بيئة العض الجديدة
3-اتبع مسارات عمل التحرير الجديدة

التحرير في ArcGIS Desktop

تتميز بيئة التحرير المحسّنة في ArcGIS Desktop 10 بواجهة تحرير مُعاد تنظيمها توفر وصولاً أسهل إلى الأدوات. تقدم هذه الدورة تدفقات عمل تحرير مبسطة جديدة ، والتي توفر تجربة أكثر سهولة وتسمح بإكمال مهام تحرير البيانات بشكل أسرع.

اهداف الدورة
1- صِف سبب أهمية الشكل المستخدم لنمذجة الأرض لرسم خرائط نظم المعلومات الجغرافية وتحليلها
2- افهم كيف يحدد نظام خطوط الطول والعرض مواضع على سطح الأرض
3- قم بتحويل وحدات خطوط الطول والعرض إلى درجات عشرية
4- شاهد كيف يؤثر اختيار نظام الإحداثيات الجغرافي على مواقع المعالم والقياسات على خريطة GIS

أساسيات نظم الإحداثيات الجغرافية

كيف يمكنك تمثيل موقع الميزات الموجودة على سطح الأرض ثلاثي الأبعاد على قطعة من الورق ثنائية الأبعاد أو شاشة الكمبيوتر بدقة؟ في نظام المعلومات الجغرافية ، تبدأ الإجابة بنظام إحداثيات جغرافي. في هذه الدورة ، تعلمت المفاهيم الأساسية لأنظمة الإحداثيات الجغرافية وبعض التاريخ وراء تطورها. أرى أيضًا كيف أثرت التحسينات في التكنولوجيا على دقة خرائط GIS والقياسات التي تم إجراؤها منها.

اهداف الدورة
1.نشر خدمات المعالم المُستضافة وخدمات الخرائط المتجانبة على ArcGIS Online
2.إنشاء خريطة الويب وتكوينها بسرعة باستخدام عارض خرائط ArcGIS Online
3.استخدم قالب ArcGIS Online لمشاركة خريطة الويب بسهولة كتطبيق ويب
4. اختر مستويات المشاركة المناسبة لاستيعاب المستخدمين المستهدفين لخريطة الويب أو تطبيق الويب

تأليف خرائط الويب باستخدام ArcGIS Online

تستخدم المؤسسات ArcGIS Online لتسهيل التعاون والوصول الفعال إلى الخرائط وموارد GIS الأخرى. تُظهر هذه الدورة التدريبية كيفية نشر البيانات وطبقات الخريطة مباشرةً إلى ArcGIS Online كخدمات ، ثم استخدام هذه الخدمات لإنشاء خريطة ويب بسرعة ، كما تعلمت أيضًا كيفية تحويل خريطة الويب إلى تطبيق ويب لتوفير تجربة مركزة للجمهور.

اهداف الدورة
1- استخدم مرجع REST API لفهم المعلمات وقيم الإدخال والصياغة المطلوبة لإجراء العمليات على الخدمة
2- اختبار الخدمات للتحقق من أدائها بالشكل المتوقع
3- تطبيق عملية قياسية لاستكشاف أخطاء الخدمة غير المتوقعة وإصلاحها

مقدمة لـ ArcGIS for Server REST API

ساعدتني هذه الدورة التدريبية على فهم ماهية ArcGIS for Server REST API وكيف أنها تساعدني في العثور على موارد GIS واكتشاف إمكانياتها واستخدامها في الخرائط والتطبيقات الخاصة بي. لقد تعلمت كيف تقوم REST API بترجمة الاتصالات التي تبدو معقدة بين العميل والخادم إلى تنسيق سهل يمكنني تفسيره والاستفادة منه بسهولة عند العمل مع منتجات وتطبيقات Esri الأخرى.

اهداف الدورة
1- اختر بيئة البرمجة النصية Python التي تلبي احتياجاتك
2- اختر أنواع البيانات المناسبة وقم بتطبيق قواعد بناء جملة بايثون عند كتابة نص برمجي
3- قم بتسمية معالم الخريطة باستخدام تعبير بايثون
4- فهم أنواع الأخطاء الشائعة وكيفية تصحيحها.

Python هي لغة البرمجة النصية المختارة لمنصة ArcGIS. قدمت هذه الدورة التدريبية مفاهيم Python الأساسية وبيئة برمجة Python في ArcGIS. تم تقديم نصائح وتقنيات لمساعدة رئيسي في بناء جملة Python المناسب وتدفق البرنامج النصي ومعالجة الأخطاء.

اهداف الدورة
1.إنشاء نصوص بايثون الأساسية باستخدام بناء الجملة الصحيح
2- كتابة البرامج النصية وتشغيلها في ArcMap باستخدام نافذة Python
3- استخدم بايثون في حاسبة الحقول
4- إنشاء أدوات نصية لأتمتة عمليات المعالجة الجغرافية

استخدام Python في ArcGIS Desktop 10

في ArcGIS Desktop 10 ، تم دمج برمجة Python النصية بإحكام في ArcMap و ArcCatalog ، مما يسمح لك بإنشاء مهام سير عمل GIS وأتمتتها بسرعة وسهولة. تقدم هذه الدورة التدريبية برمجة Python النصية في ArcGIS Desktop وتوضح كيف يمكنني استخدام البرامج النصية لزيادة الإنتاجية وجودة الخرائط والبيانات الخاصة بي. تعلمت أيضًا كيفية استخدام وحدة تعيين ArcPy الجديدة لمعالجة مستندات الخريطة والطبقات.

اهداف الدورة
1. الوصول إلى خرائط الويب المشتركة باستخدام تطبيق ArcGIS for iOS
2. البحث عن ميزات الخريطة والوصول إلى المعلومات عنها
3. قياس المسافات والمناطق على خريطة الويب
4 قم بتجميع وتحرير البيانات في الحقل باستخدام تطبيق ArcGIS for iOS
5- إرفاق صورة بميزة الخريطة

Mobile GIS: استخدام تطبيق ArcGIS for iOS

تعلمت كيفية الوصول إلى خرائط الويب المشتركة والعمل معها باستخدام تطبيق ArcGIS for iOS المجاني. يتيح توفير الوصول إلى خرائط الويب التي تدعم GIS لمستخدمي iPhone و iPad و iPod touch استكشاف البيانات المستضافة على خادمك أو على ArcGIS Online اكتشاف المعلومات في خرائط تفاعلية غنية بصريًا وجمع بيانات GIS وتحديثها في الحقل - والتي بدورها يمكن تبسيط سير عمل جمع البيانات ، وتعزيز مشاركة المواطنين ، والمساعدة في زيادة عملة قاعدة بيانات GIS الخاصة بك.


Arcgis.features.FeatureLayerCollection

مجموعة FeatureLayerCollection هي مجموعة من طبقات المعالم والجداول ، مع العلاقات المرتبطة بين الكيانات.

في نظام المعلومات الجغرافية على الويب ، يتم عرض مجموعة طبقات المعالم كخدمة معالم ذات طبقات معالم متعددة.

يمكن الحصول على مثيلات FeatureDatasets من عناصر خدمة المعالم في GIS باستخدام FeatureLayerCollection.fromitem (عنصر) ، أو من نقاط نهاية خدمة المعالم باستخدام المُنشئ ، أو عن طريق الوصول إلى سمة مجموعة البيانات لكائنات طبقة المعالم.

FeatureDatasets يمكن تكوينها وإدارتها باستخدام كائن مساعد المدير.

إذا كانت مجموعة البيانات تدعم عملية المزامنة ، فإن كائن مساعد النسخ المتماثلة يسمح بإدارة ومزامنة النسخ المتماثلة للتحرير غير المتصل لمجموعة طبقة المعلم.

ملاحظة: يمكنك استخدام خاصية الطبقات والجداول للوصول إلى الطبقات والجداول الفردية في مجموعة طبقات المعالم هذه.

كائن مساعد لإدارة مجموعة طبقة المعالم ، وتحديث تعريفها ، وما إلى ذلك

خصائص هذا الكائن

استفسار ( layer_defs_filter = لا شيء, geometry_filter = لا شيء, time_filter = لا شيء, return_geometry = صحيح, return_ids_only = خطأ, return_count_only = خطأ, return_z = خطأ, return_m = خطأ, out_sr = لا شيء ) ¶

يستعلم عن مجموعة طبقات المعالم

query_related_records ( object_ids, معرف_العلاقة, out_fields = '*', تعريف_تعبير = لا شيء, return_geometry = صحيح, max_allowable_offset = لا شيء, geometry_precision = لا شيء, out_wkid = لا شيء, gdb_version = لا شيء, return_z = خطأ, return_m = خطأ ) ¶

يتم تنفيذ عملية الاستعلام على مورد طبقة خدمة المعالم. نتيجة هذه العملية هي مجموعات المعالم المجمعة حسب معرفات كائنات الجدول / الطبقة المصدر. تحتوي كل مجموعة ميزات على كائنات ميزة بما في ذلك قيم الحقول التي يطلبها المستخدم. بالنسبة للطبقات ذات الصلة ، إذا طلبت معلومات هندسية ، فإن الشكل الهندسي لكل معلم يتم إرجاعه أيضًا في مجموعة المعالم. بالنسبة للجداول ذات الصلة ، لا تتضمن مجموعة المعالم الأشكال الهندسية. المدخلات:

objectIds - معرفات الكائن للجدول / الطبقة المطلوب الاستعلام عنها معرّف العلاقة - معرّف العلاقة المطلوب الاستعلام عنها. outFields - قائمة الحقول من الجدول / الطبقة ذات الصلة

outWKID - الإسناد المكاني للهندسة التي تم إرجاعها. gdbVersion - إصدار قاعدة البيانات الجغرافية للاستعلام. هذه المعلمة

يقوم بتحميل عنصر جديد إلى الخادم. بمجرد اكتمال العملية بنجاح ، يتم إرجاع بنية JSON للعنصر الذي تم تحميله.

المعلمات:

طريق:مسار الملف للتحميل
وصف:نص وصفي اختياري لعنصر التحميل


2 إجابات 2

الهدف الأساسي من تصميم Go هو أن يكون سهل التعلم وسهل الاستخدام حتى للمبرمجين دون المتوسطين ، لذلك إذا كنت ترغب في كتابة اصطلاحية ، اذهب إلى النمط المضاد الذي يجب أن تتجنبه أكثر من ذلك هو & quotClever Code & quot anti-pattern.

لسبب وجيه لعدم السماح بالوظائف المتداخلة على الرغم من السماح بالوظائف المجهولة - أحد الاختلافات بين Python و Go هو أن Python لا تحتاج إلى وظيفة رئيسية. يمكنك فقط كتابة:

وسيبدأ مترجم بايثون في القراءة من أعلى إلى أسفل. عندما تصل إلى def foo (): ستنشئ وظيفة ، وعندما تصل إلى foo () ، ستُشغل هذه الوظيفة. يكون المترجم دائمًا في نفس الوضع (هذا ، على الأقل ، التجريد) - وضع القراءة والتقييم. إنها تعمل بنفس الطريقة سواء كانت داخل أو خارج وظيفة ، لذلك من السهل عليها دعم نسخ كل هذا الرمز إلى داخل وظيفة - ستضيف فقط إطارًا آخر إلى Callstack الخاص بها وبخلاف ذلك تفعل الشيء نفسه بالضبط.

اذهب قصة مختلفة. عندما تكتب

المترجم يقرأ المستوى الأعلى في تصريحي الوضع ، ويخلق الوظائف ، ولكن جسم الوظائف الذي يقرأ فيه صيغة الامر الوضع. في تصريحي الوضع يمكنه إنشاء وظائف وفي صيغة الامر الوضع يمكنه تشغيل البيانات. سيتطلب السماح بالوظائف المتداخلة إضافة وظيفة إعلان الوظيفة إلى صيغة الامر الوضع.

فلماذا ، قد يتساءل المرء ، لا تضيف هذه الوظيفة إلى صيغة الامر الوضع؟ السبب الرئيسي هو التعامل مع الإغلاق:

كتابة شيء من هذا القبيل يعني أن foo ليست وظيفة عادية - فهي تحتاج إلى الوصول إلى txt ، الموجود في إطار المكدس الرئيسي ، لذا فهي تحتاج إلى مؤشر السياق سيشير ذلك إلى هذا الإطار. إذا تم استدعاء main مرة أخرى ، فسيتم إنشاء foo آخر بمؤشر سياق مختلف.

هذا يجعل الوظائف المتداخلة مختلفة بشكل أساسي عن الوظائف العادية ، وهذا سبب لعدم وجود وظائف متداخلة. لا توجد هذه المشكلات في Python ، لأن كل وظائفها عبارة عن عمليات إغلاق - كلها & quot ؛ متداخلة & quot.


6.2 - طريقة Z Score

باستخدام Z Score يمكننا أن نجد أبعد من ذلك

6.2.1 - ما هي معايير تحديد الخارج؟

نقطة البيانات التي تقع خارج 3 انحرافات معيارية. يمكننا استخدام درجة z وإذا كانت النتيجة z تقع خارج 2 الانحراف المعياري.

6.2.2 - فيما يلي خطوات إزالة الخارج

الخطوة 1: - جمع البيانات وقراءة الملف

الخطوة 2: - التحقق من شكل البيانات

الخطوه 3: - احصل على جدول Z-Score.

نجد درجة z لكل نقطة بيانات في مجموعة البيانات وإذا كانت درجة z أكبر من 3 مما يمكننا تصنيف هذه النقطة على أنها خارجية. أي نقطة خارج 3 انحرافات معيارية ستكون شاذة.


Arcgis.features.SpatialDataFrame¶

إطار البيانات المكانية هو كائن لمعالجة البيانات وإدارتها وترجمتها إلى أشكال جديدة من المعلومات للمستخدمين.

المعلمات المطلوبة: لا شيء اختياري:

بيانات بارام:يحتوي إطار بيانات الباندا على معلومات السمة
هندسة بارام:قائمة / مجموعة / geoseries لكائنات arcgis.geometry
بارام ريال:الإسناد المكاني لإطار البيانات. يمكن أن يكون هذا رمز المصنع أو سلسلة WKT أو كائن Arcpy.SpatialReference أو كائن Arcgis.SpatailReference.
بارام جيس:سيضمن تمرير كائن gis.GIS المعين إلى Pro تثبيت Arcpy وإتاحة عينة كاملة من الوظائف للمستخدم النهائي.
جسون ¶

لعرض تمثيل Esri JSON للشكل الهندسي كسلسلة.

تبديل الفهرس والأعمدة

لعرض التمثيل الثنائي المعروف جيدًا (WKB) لهندسة OGC. يوفر تمثيلًا محمولًا لقيمة هندسية كتيار متجاور من البايتات.

إرجاع تمثيل النص المعروف (WKT) لهندسة OGC. يوفر تمثيلًا محمولًا لقيمة هندسية كسلسلة نصية.

قم بإرجاع كائن بقيمة مطلقة مأخوذة - تنطبق فقط على الكائنات التي تكون جميعها رقمية.

إضافة إطار البيانات وغيره ، من ناحية العناصر (إضافة عامل ثنائي).

مكافئ لـ dataframe + other ، ولكن مع دعم لاستبدال fill_value عن البيانات المفقودة في أحد المدخلات.

أخرى: متسلسلة أو DataFrame أو محور ثابت:

سيتم توحيد المؤشرات غير المتطابقة معًا

سلسلة بادئة متسلسلة بأسماء عناصر اللوحة.

with_prefix: نوع المتصل

سلسلة لاحقة متسلسلة بأسماء عناصر اللوحة.

with_suffix: نوع المتصل

التجميع باستخدام callable ، أو string ، أو dict ، أو قائمة من السلسلة / callables

وظيفة لاستخدامها في تجميع البيانات. إذا كانت الوظيفة ، يجب أن تعمل إما عند تمرير DataFrame أو عند تمريرها إلى DataFrame.apply. بالنسبة إلى DataFrame ، يمكن تمرير أمر ، إذا كانت المفاتيح عبارة عن أسماء أعمدة DataFrame.

المجموعات المقبولة هي:

  • اسم دالة السلسلة
  • وظيفة
  • قائمة الوظائف
  • ديكت أسماء الأعمدة - دالات & gt (أو قائمة الوظائف)

الدوال الصفرية تعني / الوسيط / prod / sum / std / var هي حالة خاصة ، لذا فإن السلوك الافتراضي هو تطبيق الوظيفة على طول المحور = 0 (على سبيل المثال ، np.mean (arr_2d ، المحور = 0)) بدلاً من محاكاة السلوك الافتراضي Numpy (على سبيل المثال ، np.mean (arr_2d)).

agg هو اسم مستعار للتجميع. استخدم الاسم المستعار.

قم بتجميع هذه الوظائف عبر جميع الأعمدة

مجموعات مختلفة لكل عمود

pandas.DataFrame.apply pandas.DataFrame.transform pandas.DataFrame.groupby.aggregate pandas.DataFrame.resample.aggregate pandas.DataFrame.rolling.aggregate

التجميع باستخدام callable ، أو string ، أو dict ، أو قائمة من السلسلة / callables

وظيفة لاستخدامها في تجميع البيانات. إذا كانت الوظيفة ، يجب أن تعمل إما عند تمرير DataFrame أو عند تمريرها إلى DataFrame.apply. بالنسبة إلى DataFrame ، يمكن تمرير أمر ، إذا كانت المفاتيح عبارة عن أسماء أعمدة DataFrame.

المجموعات المقبولة هي:

  • اسم دالة السلسلة
  • وظيفة
  • قائمة الوظائف
  • دوال أسماء الأعمدة - وظائف & gt (أو قائمة الوظائف)

الدوال الصفرية تعني / الوسيط / prod / sum / std / var هي حالة خاصة ، لذا فإن السلوك الافتراضي هو تطبيق الوظيفة على طول المحور = 0 (على سبيل المثال ، np.mean (arr_2d ، المحور = 0)) بدلاً من محاكاة السلوك الافتراضي Numpy (على سبيل المثال ، np.mean (arr_2d)).

agg هو اسم مستعار للتجميع. استخدم الاسم المستعار.

قم بتجميع هذه الوظائف عبر جميع الأعمدة

مجموعات مختلفة لكل عمود

pandas.DataFrame.apply pandas.DataFrame.transform pandas.DataFrame.groupby.aggregate pandas.DataFrame.resample.aggregate pandas.DataFrame.rolling.aggregate

محاذاة ( آخر, انضم = 'خارجي', المحور = لا شيء, المستوى = لا شيء, نسخ = صحيح, fill_value = لا شيء, الطريقة = لا شيء, الحد = لا شيء, ملء_محور = 0, إذاعة_محور = لا شيء ) ¶

قم بمحاذاة كائنين على محوريهما باستخدام طريقة الربط المحددة لكل فهرس محور

آخر: DataFrame أو سلسلة الصلة: <"خارجي" ، "داخلي" ، "يسار" ، "يمين"> ، المحور الافتراضي "الخارجي": المحور المسموح به للكائن الآخر ، الافتراضي لا شيء

الطريقة: str ، الافتراضي بلا حدود: int ، default لا شيء fill_axis: <0 or "index" ، 1 أو "عمود"> ، افتراضي 0

بث القيم على طول هذا المحور ، في حالة محاذاة كائنين بأبعاد مختلفة

قم بإرجاع ما إذا كانت جميع العناصر صحيحة عبر المحور المطلوب

المحور: skipna: منطقي ، افتراضي صحيح

الكل: سلسلة أو DataFrame (إذا تم تحديد المستوى)

الزاوية_المسافة_إلى ( الهندسة_الثانية, الطريقة = "الجيوديسيك" ) ¶

تُرجع مجموعة من الزاوية والمسافة إلى نقطة أخرى باستخدام نوع قياس.

البيانات الموجودة على السطح ثنائي الأبعاد (بمعنى آخر ، لن تأخذ في الاعتبار انحناء الأرض). يمكن اختيار أنواع القياس GEODESIC و GREAT_ELLIPTIC و LOXODROME و PRESERVE_SHAPE كبديل ، إذا رغبت في ذلك.

قم بإرجاع ما إذا كان أي عنصر صحيحًا عبر المحور المطلوب

المحور: skipna: منطقي ، افتراضي صحيح

أي: سلسلة أو DataFrame (إذا تم تحديد المستوى)

ألحق ( آخر, ignore_index = خطأ, Verify_integrity = خطأ ) ¶

قم بإلحاق صفوف أخرى بنهاية هذا الإطار ، مع إعادة كائن جديد. تتم إضافة الأعمدة غير الموجودة في هذا الإطار كأعمدة جديدة.

other: DataFrame أو كائن متسلسل / ديكت شبيه ، أو قائمة بهذه البيانات المطلوب إلحاقها. ignore_index: منطقي ، افتراضي خطأ إذا كان هذا صحيحًا ، لا تستخدم ملصقات الفهرس. check_integrity: منطقية ، افتراضية خطأ إذا كانت صحيحة ، قم بزيادة ValueError عند إنشاء فهرس مع التكرارات.

إذا تم تمرير قائمة من dict / series وتم تضمين جميع المفاتيح في فهرس DataFrame ، فلن يتغير ترتيب الأعمدة في DataFrame الناتج.

يمكن أن يكون إلحاق الصفوف بشكل متكرر بإطار بيانات أكثر كثافة من الناحية الحسابية من سلسلة واحدة. الحل الأفضل هو إلحاق هذه الصفوف بقائمة ثم ربط القائمة مع DataFrame الأصلي مرة واحدة.

pandas.concat: وظيفة عامة لسلسلة كائنات DataFrame أو Series أو Panel

مع تعيين ignore_index إلى True:

تُظهر الطرق التالية ، على الرغم من أنها ليست طرقًا موصى بها لإنشاء إطارات البيانات ، طريقتين لإنشاء إطار بيانات من مصادر بيانات متعددة.

يطبق الوظيفة على طول محور الإدخال في DataFrame.

الكائنات التي يتم تمريرها إلى الوظائف هي كائنات السلسلة التي لها فهرس إما فهرس DataFrame (المحور = 0) أو الأعمدة (المحور = 1). يعتمد نوع الإرجاع على ما إذا كان يتم تمرير تجميعات الدالة أو وسيطة تقليل إذا كان DataFrame فارغًا.

سيتم تمرير وسيطات الكلمات الأساسية الإضافية ككلمات رئيسية إلى الوظيفة

في التطبيق الحالي ، قم بتطبيق الاستدعاءات func مرتين على العمود / الصف الأول لتحديد ما إذا كان يمكن أن يأخذ مسار رمز سريع أو بطيء. يمكن أن يؤدي هذا إلى سلوك غير متوقع إذا كان لـ func آثار جانبية ، حيث ستصبح سارية مرتين بالنسبة للعمود / الصف الأول.

DataFrame.applymap: لعمليات العناصر DataFrame.aggregate: إجراء عمليات النوع التجميعي فقط DataFrame.transform: إجراء عمليات تحويل النوع فقط

تم تطبيقه: سلسلة أو DataFrame

قم بتطبيق دالة على DataFrame التي تهدف إلى العمل بطريقة العناصر ، أي مثل عمل خريطة (func ، سلسلة) لكل سلسلة في DataFrame

func: دالة دالة بايثون ، ترجع قيمة واحدة من قيمة واحدة

DataFrame.apply: للعمليات على الصفوف / الأعمدة

مساحة عنصر المضلع. فارغ لجميع أنواع الميزات الأخرى.

لعرض تمثيل Esri JSON للشكل الهندسي كسلسلة.

تحويل الإطار إلى dtype dtype - & gt Constructor Types التي لكل منها نوع dtype متجانس.

مهملة منذ الإصدار 0.21.0.

نسخ: منطقي ، افتراضي صحيح

القيم: ديكت من نوع dtype - & gt Constructor Types

قم بتحويل الإطار إلى تمثيل مصفوفة Numpy الخاصة به.

الأعمدة: قائمة ، اختيارية ، افتراضية: لا شيء إذا لم تكن موجودة ، قم بإرجاع جميع الأعمدة ، وإلا ، يتم إرجاع الأعمدة المحددة. القيم: ndarray إذا كان المتصل غير متجانس ويحتوي على قيم منطقية أو كائنات ، فستكون النتيجة dtype = object. انظر إلى الملاحظات.

العودة ليست مصفوفة Numpy ، بل هي مصفوفة Numpy.

سيكون dtype عبارة عن نوع dtype ذي قاسم مشترك أقل (التنبيه الضمني) أي أنه إذا كانت الأنواع dtype (حتى من الأنواع الرقمية) مختلطة ، فسيتم اختيار النوع الذي يستوعب الجميع. استخدم هذا بعناية إذا كنت لا تتعامل مع الكتل.

على سبيل المثال إذا كانت dtypes هي float16 و float32 ، فسيكون dtype up إلى float32. إذا كانت dtypes هي int32 و uint8 ، فسيكون dtype بالأحرف العلوية إلى int32. من خلال اصطلاح numpy.find_common_type ، سيؤدي خلط int64 و uint64 إلى flot64 dtype.

يتم توفير هذه الطريقة للتوافق مع الإصدارات السابقة. بشكل عام ، يوصى باستخدام ".values".

اسفريق ( التكرار, الطريقة = لا شيء, كيف = لا شيء, تطبيع = خطأ, fill_value = بلا ) ¶

تحويل TimeSeries إلى تردد محدد.

توفير طريقة تعبئة اختياريًا للبطانة / إعادة ملء القيم المفقودة.

إرجاع البيانات الأصلية المطابقة لفهرس جديد بالتردد المحدد. إعادة العينة أكثر ملاءمة إذا كانت عملية ما ، مثل التلخيص ، ضرورية لتمثيل البيانات عند التردد الجديد.

freq: كائن DateOffset ، أو طريقة السلسلة: <"backfill" / "bfill"، "pad" / "ffill"> ، افتراضي بلا

  • "pad" / "ffill": نشر آخر ملاحظة صالحة للأمام إلى الحالة التالية الصالحة
  • "backfill" / "bfill": استخدم الملاحظة الصالحة التالية للملء

القيمة التي يجب استخدامها للقيم المفقودة ، المطبقة أثناء الاختزال (لاحظ أن هذا لا يملأ NaNs الموجودة بالفعل).

تم التحويل: نوع المتصل

ابدأ بإنشاء سلسلة من 4 طوابع زمنية دقيقة واحدة.

قم بتجميع السلسلة في حاويات 30 ثانية.

Upsample مرة أخرى ، مما يوفر قيمة تعبئة.

Upsample مرة أخرى ، مما يوفر طريقة.

لمعرفة المزيد حول سلاسل التردد ، يرجى الاطلاع على هذا الارتباط.

يتم أخذ الصف الأخير بدون أي NaN (أو يتم أخذ الصف الأخير بدون NaN مع مراعاة مجموعة الأعمدة الفرعية فقط في حالة DataFrame)

الجديد في الإصدار 0.19.0: For DataFrame

في حالة عدم وجود قيمة جيدة ، يتم إرجاع NaN لسلسلة قيم سلسلة a من NaN لإطار DataFrame

حيث: التاريخ أو مجموعة التواريخ الفرعية: سلسلة أو قائمة السلاسل ، الافتراضي بلا

من المفترض أن يتم فرز التواريخ تزيد الزيادات إذا لم يكن الأمر كذلك

أين هو الفهرس: نفس كائن الشكل كإدخال

قم بتعيين أعمدة جديدة إلى DataFrame ، مع إعادة كائن جديد (نسخة) مع جميع الأعمدة الأصلية بالإضافة إلى الأعمدة الجديدة.

kwargs: الكلمات الرئيسية ، أزواج القيمة هي أسماء الأعمدة. إذا كانت القيم قابلة للاستدعاء ، يتم حسابها على DataFrame وتعيينها إلى الأعمدة الجديدة. يجب ألا يغير الملف القابل للاستدعاء DataFrame (على الرغم من أن الباندا لا تتحقق منه). إذا كانت القيم غير قابلة للاستدعاء (على سبيل المثال ، سلسلة أو عددية أو مصفوفة) ، يتم تعيينها ببساطة. df: DataFrame إطار بيانات جديد مع الأعمدة الجديدة بالإضافة إلى جميع الأعمدة الموجودة.

بالنسبة إلى python 3.6 وما فوق ، يتم إدخال الأعمدة بترتيب ** kwargs. بالنسبة إلى python 3.5 والإصدارات الأقدم ، نظرًا لأن ** kwargs غير مرتبة ، يتم إدراج الأعمدة بترتيب أبجدي في نهاية DataFrame. من الممكن تعيين أعمدة متعددة في نفس التعيين ، لكن لا يمكنك الرجوع إلى الأعمدة الأخرى التي تم إنشاؤها داخل نفس الاستدعاء.

عندما تكون القيمة قابلة للاستدعاء ، يتم تقييمها على df:

حيث توجد القيمة بالفعل ويتم إدراجها:

إرسال كائن الباندا إلى نوع dtype المحدد.

dtype: نوع البيانات ، أو إملاء اسم العمود - نوع بيانات & gt استخدم نوع numpy.dtype أو نوع Python لإرسال كائن الباندا بأكمله إلى نفس النوع. بدلا من ذلك ، استخدم ، حيث يكون العمود عبارة عن تسمية عمود ونوع dtype عبارة عن نوع numpy.dtype أو نوع Python لإرسال واحد أو أكثر من أعمدة DataFrame إلى أنواع خاصة بالأعمدة. نسخ: منطقي ، افتراضي صحيح. قم بإرجاع نسخة عندما يكون copy = صحيحًا (كن حذرًا للغاية ، حيث أن النسخة الضبطية = False لأن التغييرات في القيم قد تنتشر إلى كائنات الباندا الأخرى). الأخطاء: <"رفع" ، "تجاهل"> ، الافتراضي "رفع".

التحكم في رفع الاستثناءات على البيانات غير الصالحة لنوع dtype المقدم.

  • رفع: السماح برفع الاستثناءات
  • تجاهل: قم بإلغاء الاستثناءات. عند الخطأ ، قم بإرجاع الكائن الأصلي

مهملة منذ الإصدار 0.20.0: استخدم الأخطاء بدلاً من ذلك

kwargs: وسيطات الكلمات الرئيسية لتمريرها إلى المنشئ

التحويل إلى النوع الفئوي:

التحويل إلى نوع فئوي مرتب بترتيب مخصص:

لاحظ أن استخدام copy = False وتغيير البيانات في كائن الباندا الجديد قد يؤدي إلى نشر التغييرات:

pandas.to_datetime: تحويل الوسيطة إلى datetime. pandas.to_timedelta: تحويل الوسيطة إلى timedelta. pandas.to_numeric: تحويل الوسيطة إلى نوع رقمي. numpy.ndarray.astype: إرسال مصفوفة صغيرة إلى نوع محدد.

موصّل عددي سريع قائم على الملصق

على غرار loc ، في يوفر ضع الكلمة المناسبة عمليات البحث العددية القائمة. يمكنك أيضًا تعيين باستخدام هذه المفهرسات.

حدد قيمًا في وقت معين من اليوم (على سبيل المثال 9:30 صباحًا).

الوقت: التاريخ والوقت أو السلسلة

القيم_at_time: نوع المتصل

قم بإرجاع قائمة بتسميات محور الصف وتسميات محور العمود كأعضاء فقط. يتم إعادتهم بهذا الترتيب.

بين الوقت ( وقت البدء, وقت النهاية, include_start = صحيح, include_end = صحيح ) ¶

حدد القيم بين أوقات معينة من اليوم (على سبيل المثال ، 9:00 - 9:30 صباحًا).

start_time: datetime.time أو string end_time: datetime.time or string include_start: boolean، default true include_end: منطقي ، افتراضي صحيح

القيم_بين_وقت: نوع المتصل

بفل ( المحور = لا شيء, inplace = خطأ, الحد = لا شيء, هبوط = لا شيء ) ¶

مرادف DataFrame.fillna (الطريقة = 'bfill')

الخاصية الداخلية ، الخاصية مرادف لـ as_blocks ()

موقوف منذ الإصدار 0.21.0.

إرجاع منطقي لعنصر واحد PandasObject.

يجب أن تكون هذه قيمة عددية منطقية ، إما صواب أو خطأ. رفع ValueError إذا كان PandasObject لا يحتوي على عنصر واحد بالضبط ، أو أن هذا العنصر ليس منطقيًا

يبني حدود الهندسة.

قم بإرجاع DataFrame للقيم minx و miny و maxx و maxy للكائنات الهندسية

قم بعمل مخطط مربع من عمود DataFrame مجمَّعًا اختياريًا حسب بعض الأعمدة أو المدخلات الأخرى

البيانات: كائن الباندا الذي يحتفظ بعمود البيانات: اسم العمود أو قائمة الأسماء ، أو المتجه

المحور: كائن محاور Matplotlib ، حجم الخطوط الاختياري: int أو سلسلة rot: حجم زاوية دوران التسمية: مجموعة (عرض ، ارتفاع) في شبكة بوصة: سيؤدي تعيين هذا إلى True إلى إظهار تخطيط الشبكة: tuple (اختياري)

نوع الكائن المراد إرجاعه. الافتراضي هو "المحاور" التي تعرض محاور matplotlib ، حيث يتم رسم مربع boxplot على "إملاء" إرجاع القاموس الذي تكون قيمه خطوط matplotlib الخاصة بـ boxplot "كلاهما" يُرجع اسمًا مضاعفًا بالمحاور وإملاء.

عند التجميع باستخدام بواسطة ، يتم إرجاع أعمدة تعيين سلسلة إلى نوع return ، ما لم يكن return_type هي None ، وفي هذه الحالة يتم إرجاع مصفوفة محاور NumPy بنفس شكل التخطيط. انظر وثائق النثر للمزيد.

kwds: سيتم تمرير وسيطات الكلمات الرئيسية الأخرى للتخطيط إلى دالة matplotlib boxplot

الأسطر: dict ax: matplotlib المحاور (الفأس ، الخطوط): namedtuple

استخدم return_type ='ict 'عندما تريد تعديل مظهر الخطوط بعد التخطيط. في هذه الحالة ، يتم إرجاع إملاء يحتوي على الخطوط التي تشكل المربعات والقبعات والمنشورات والمتوسطات والشعيرات.

يبني مضلعًا على مسافة محددة من الهندسة.

النقطه الوسطى الحقيقية إذا كانت داخل أو في الميزة خلاف ذلك ، يتم إرجاع نقطة التسمية. إرجاع كائن نقطي.

يبني تقاطع الهندسة والمدى المحدد.

نسخة إرجاع من المدخلات مع القيم أدناه تم اقتطاع القيمة (القيم) المحددة.

العتبة: المحور العائم أو المصفوفة: int أو اسم محور السلسلة ، اختياري

مقطوع: نفس نوع الإدخال

clip_upper ( عتبة, المحور = لا شيء, inplace = خطأ ) ¶

نسخة إرجاع من المدخلات مع القيم المذكورة أعلاه تم اقتطاع القيمة (القيم).

العتبة: المحور العائم أو المصفوفة: int أو اسم محور السلسلة ، اختياري

مقطوع: نفس نوع الإدخال

يجمع ( آخر, func, fill_value = لا شيء, الكتابة فوق = صحيح ) ¶

أضف كائنين من كائنات DataFrame ولا تنشر قيم NaN ، لذلك إذا كان أحد الإطارات يفتقد قيمة (عمود ، وقت) ، فسيتم تعيينه افتراضيًا على قيمة الإطار الآخر (والتي قد تكون NaN أيضًا)

other: DataFrame func: function fill_value: الكتابة فوق القيمة العددية: منطقية ، افتراضي صحيح

اجمع بين كائنين من كائنات DataFrame والافتراضي للقيم غير الخالية في الإطار الذي يستدعي الأسلوب. ستكون أعمدة فهرس النتائج عبارة عن اتحاد الفهارس والأعمدة ذات الصلة

تم إعطاء الأولوية لقيم a ، استخدم القيم من b لملء الثقوب:

مجمع ( المحور = لا شيء, skipna = لا شيء, المستوى = لا شيء ) ¶

إرجاع النسبة المئوية المركبة لقيم المحور المطلوب

المحور: skipna: منطقي ، افتراضي صحيح

مركب: سلسلة أو DataFrame (إذا تم تحديد المستوى)

متوقف: سيكون الدمج تنفيذًا داخليًا فقط.

يحتوي على ( الهندسة_الثانية, علاقة = لا شيء ) ¶

يشير إلى ما إذا كانت الهندسة الأساسية تحتوي على هندسة المقارنة.

إهمال. محاولة استنتاج نوع dtype أفضل لأعمدة الكائن

convert_dates: منطقي ، افتراضي True If True ، قم بالتحويل إلى التاريخ حيثما أمكن ذلك. في حالة "الإكراه" ، فرض التحويل ، بحيث تصبح القيم غير القابلة للتحويل NaT. convert_numeric: منطقي ، افتراضي False إذا كان صحيحًا ، حاول الإكراه على الأرقام (بما في ذلك السلاسل) ، بحيث تصبح القيم غير القابلة للتحويل NaN. convert_timedeltas: منطقي ، افتراضي True If True ، قم بالتحويل إلى timedelta حيثما أمكن ذلك. في حالة "الإكراه" ، فرض التحويل ، بحيث تصبح القيم غير القابلة للتحويل NaT. نسخ: منطقي ، افتراضي صحيح إذا كان صحيحًا ، قم بإرجاع نسخة حتى إذا لم تكن هناك حاجة إلى نسخة (على سبيل المثال ، لم يتم إجراء تحويل) ملحوظة: هذا مخصص للاستخدام الداخلي ، ويجب عدم الخلط بينه وبين inplace.

pandas.to_datetime: تحويل الوسيطة إلى datetime. pandas.to_timedelta: تحويل الوسيطة إلى timedelta. pandas.to_numeric: إرجاع فهرسelta ذي التردد الثابت ،

المحولة: نفس كائن الإدخال

تُنشئ الشكل الهندسي الذي يمثل الحد الأدنى لمضلع الإحاطة بحيث تكون جميع الزوايا الخارجية محدبة.

إرجاع إحداثيات نقطة الهندسة ككائن np.array

قم بعمل نسخة من معلمات الكائن SpatialDataFrame:

عميق:منطقي ، صحيح افتراضي ، عمل نسخة عميقة ، أي نسخ البيانات أيضًا
عائدات:
ينسخ:من SpatialDataFrame
كور ( الطريقة = "بيرسون", min_periods = 1 ) ¶

حساب الارتباط الزوجي للأعمدة ، باستثناء القيم NA / خالية

  • بيرسون: معامل الارتباط القياسي
  • كيندال: معامل ارتباط كيندال تاو
  • سبيرمان: ارتباط رتبة سبيرمان

حساب الارتباط الزوجي بين صفوف أو أعمدة كائنين DataFrame.

آخر: محور DataFrame: <0 أو "index" ، 1 أو "أعمدة"> ، الافتراضي 0

عدد ( المحور = 0, المستوى = لا شيء, numeric_only = خطأ ) ¶

سلسلة إرجاع مع عدد الملاحظات غير NA / الفارغة على المحور المطلوب. يعمل مع بيانات الفاصلة غير العائمة أيضًا (يكتشف NaN و None)

المحور: <0 أو "الفهرس" ، 1 أو "الأعمدة"> ، الافتراضي 0 0 أو "الفهرس" للصفوف ، 1 أو "الأعمدة" لمستوى العمود: int أو اسم المستوى ، الافتراضي لا شيء إذا كان المحور a MultiIndex (هرمي) ، العد على طول مستوى معين ، الانهيار في DataFrame numeric_only: منطقي ، افتراضي False تضمين فقط بيانات عائمة ، int ، منطقية

العد: سلسلة (أو DataFrame إذا تم تحديد المستوى)

حساب التغاير الزوجي للأعمدة ، باستثناء القيم NA / خالية

min_periods: int ، اختياري الحد الأدنى لعدد الملاحظات المطلوبة لكل زوج من الأعمدة للحصول على نتيجة صحيحة.

يحتوي y على مصفوفة التغاير للسلسلة الزمنية لـ DataFrame. يتم تطبيع التغاير بواسطة N-1 (مقدر غير متحيز).

يشير إلى ما إذا كان الشكلان الهندسيان يتقاطعان في شكل هندسي من نوع أقل شكلًا.

إرجاع الحد الأقصى التراكمي على المحور المطلوب.

المحور: skipna: منطقي ، افتراضي صحيح

pandas.core.window.Expanding.max: وظائف مماثلة لكنها تتجاهل قيم NaN. الكمون ( المحور = لا شيء, skipna = صحيح, * أرغس, ** kwargs ) ¶

إرجاع الحد الأدنى التراكمي عبر المحور المطلوب.

المحور: skipna: منطقي ، افتراضي صحيح

pandas.core.window.Expanding.min: وظائف مماثلة لكنها تتجاهل قيم NaN. كومبرود ( المحور = لا شيء, skipna = صحيح, * أرغس, ** kwargs ) ¶

إرجاع المنتج التراكمي فوق المحور المطلوب.

المحور: skipna: منطقي ، افتراضي صحيح

pandas.core.window.Expanding.prod: وظائف مماثلة لكنها تتجاهل قيم NaN. cumsum ( المحور = لا شيء, skipna = صحيح, * أرغس, ** kwargs ) ¶

إرجاع المجموع التراكمي على المحور المطلوب.

المحور: skipna: منطقي ، افتراضي صحيح

pandas.core.window.Expanding.sum: وظائف مماثلة لكنها تتجاهل قيم NaN. يقطع ( القاطع ) ¶

يقسم هذا الشكل الهندسي إلى جزء يسار من خط متعدد الخطوط وجزء يمين منه.

ينشئ هندسة جديدة برؤوس مضافة

  • نوع التكثيف أو المسافة أو الزاوية أو الجيوديسية
  • المسافة القصوى بين القمم. الفعلية

عادة ما تكون المسافة بين الرؤوس أقل من المسافة القصوى حيث سيتم توزيع الرؤوس الجديدة بالتساوي على طول المقطع الأصلي. في حالة استخدام نوع DISTANCE أو ANGLE ، يتم قياس المسافة بوحدات الإسناد المكاني للهندسة. في حالة استخدام نوع من الجيوديسيك ، يتم قياس المسافة بالأمتار.

تستخدم الانحراف للتحكم في دقة هذا التقريب. الانحراف هو أقصى مسافة بين المقطع الجديد والمنحنى الأصلي. كلما كانت قيمته أصغر ، ستكون هناك حاجة لمزيد من الأجزاء لتقريب المنحنى.

يُنشئ إحصاءات وصفية تلخص الاتجاه المركزي وتشتت وشكل توزيع مجموعة البيانات ، باستثناء قيم NaN.

يحلل كلاً من السلاسل الرقمية وسلسلة الكائنات ، بالإضافة إلى مجموعات أعمدة DataFrame لأنواع البيانات المختلطة. سيختلف الإخراج اعتمادًا على ما يتم توفيره. الرجوع إلى الملاحظات أدناه لمزيد من التفاصيل.

النسب المئوية: قائمة تشبه الأرقام ، اختيارية النسب المئوية المراد تضمينها في الإخراج. يجب أن تقع الكل بين 0 و 1. القيمة الافتراضية هي [.25 ، .5 ، .75] ، والتي تُرجع النسب المئوية 25 ، و 50 ، و 75. تشمل: "الكل" ، أو قائمة تشبه dtypes أو لا شيء (افتراضي) ، اختياري

قائمة بيضاء بأنواع البيانات لتضمينها في النتيجة. تم تجاهله من أجل السلسلة. فيما يلي الخيارات:

  • "الكل": سيتم تضمين جميع أعمدة الإدخال في الإخراج.
  • قائمة تشبه dtypes: تقصر النتائج على أنواع البيانات المتوفرة. لقصر النتيجة على أنواع رقمية ، أرسل numpy.number. لتقييده بدلاً من ذلك على أعمدة الكائن ، أرسل نوع بيانات numpy.object. يمكن أيضًا استخدام السلاسل النصية في نمط select_dtypes (مثل df.describe (include = ['O'])). لتحديد أعمدة الباندا الفئوية ، استخدم "الفئة"
  • بلا (افتراضي): ستشمل النتيجة جميع الأعمدة الرقمية.

قائمة سوداء بأنواع البيانات المطلوب حذفها من النتيجة. تم تجاهله من أجل السلسلة. فيما يلي الخيارات:

  • قائمة تشبه dtypes: تستبعد أنواع البيانات المتوفرة من النتيجة. لاستبعاد الأنواع الرقمية ، أرسل numpy.number. لاستبعاد أعمدة الكائن ، قم بإرسال نوع البيانات numpy.object. يمكن أيضًا استخدام السلاسل النصية في نمط select_dtypes (على سبيل المثال df.describe (include = ['O'])). لاستبعاد أعمدة الباندا الفئوية ، استخدم "الفئة"
  • بلا (افتراضي): لن تستبعد النتيجة أي شيء.

الملخص: سلسلة / DataFrame للإحصائيات الموجزة

بالنسبة للبيانات الرقمية ، سيتضمن فهرس النتيجة العدد والمتوسط ​​والأدنى والأقصى بالإضافة إلى النسب المئوية المنخفضة و 50 والأعلى. بشكل افتراضي ، يكون المئين الأدنى هو 25 والمئين الأعلى هو 75. النسبة المئوية الخمسين هي نفسها الوسيط.

بالنسبة لبيانات الكائن (مثل السلاسل أو الطوابع الزمنية) ، سيتضمن فهرس النتيجة العدد والفريد والأعلى والتكرار. القمة هي القيمة الأكثر شيوعًا. التكرار هو تكرار القيمة الأكثر شيوعًا. تتضمن الطوابع الزمنية أيضًا العناصر الأولى والأخيرة.

إذا كانت قيم الكائنات المتعددة تحتوي على أعلى عدد ، فسيتم اختيار العدد وأعلى النتائج بشكل تعسفي من بين تلك التي لديها أعلى عدد.

بالنسبة لأنواع البيانات المختلطة المتوفرة عبر DataFrame ، يكون الإعداد الافتراضي هو إرجاع تحليل للأعمدة الرقمية فقط. إذا كان إطار البيانات يتكون فقط من بيانات فئوية وكائنات بدون أي أعمدة رقمية ، فإن الإعداد الافتراضي هو إرجاع تحليل لكل من الكائن والأعمدة الفئوية. إذا تم توفير include = 'all' كخيار ، فستتضمن النتيجة اتحادًا من السمات من كل نوع.

يمكن استخدام معلمات التضمين والاستبعاد لتحديد الأعمدة في DataFrame التي يتم تحليلها للإخراج. يتم تجاهل المعلمات عند تحليل سلسلة.

وصف سلسلة رقمية.

وصف سلسلة فئوية.

وصف سلسلة الطابع الزمني.

وصف DataFrame. يتم إرجاع الحقول الرقمية فقط بشكل افتراضي.

وصف كل أعمدة DataFrame بغض النظر عن نوع البيانات.

وصف عمود من DataFrame عن طريق الوصول إليه كسمة.

بما في ذلك الأعمدة الرقمية فقط في وصف DataFrame.

بما في ذلك أعمدة السلسلة فقط في وصف DataFrame.

بما في ذلك الأعمدة الفئوية فقط من وصف DataFrame.

استبعاد الأعمدة الرقمية من وصف DataFrame.

استبعاد أعمدة الكائنات من وصف DataFrame.

DataFrame.count DataFrame.max DataFrame.min DataFrame.mean DataFrame.std DataFrame.select_dtypes

1 الفرق المنفصل للكائن

فترات: int ، افتراضي 1 فترات التحول لتشكيل محور الفرق: <0 أو "index" ، 1 أو "أعمدة"> ، الافتراضي 0 خذ الفرق بين الصفوف (0) أو الأعمدة (1).

يبني الهندسة التي تتكون فقط من المنطقة الفريدة للهندسة الأساسية ولكنها ليست جزءًا من الهندسة الأخرى. يوضح الرسم التوضيحي التالي النتائج عندما يكون المضلع الأحمر هو هندسة المصدر.

الإشارة إلى ما إذا كانت الهندسة الأساسية والمقارنة لا تشترك في أي نقاط.

تُرجع الحد الأدنى للمسافة بين شكلين هندسيين. إذا تقاطعت الأشكال الهندسية ، فإن أدنى مسافة هي 0. يجب أن يكون لكلا الشكلين الإسقاط نفس الإسقاط.

التقسيم العائم لإطار البيانات وغيره من العناصر (عامل التشغيل الثنائي truediv).

مكافئ لـ dataframe / آخر ، ولكن مع دعم لاستبدال fill_value عن البيانات المفقودة في أحد المدخلات.

أخرى: متسلسلة أو DataFrame أو محور ثابت:

سيتم توحيد المؤشرات غير المتطابقة معًا

يقسم ( آخر, المحور = "أعمدة", المستوى = لا شيء, fill_value = لا شيء ) ¶

التقسيم العائم لإطار البيانات وغيره من العناصر (عامل التشغيل الثنائي truediv).

مكافئ لـ dataframe / آخر ، ولكن مع دعم لاستبدال fill_value عن البيانات المفقودة في أحد المدخلات.

أخرى: متسلسلة أو DataFrame أو محور ثابت:

سيتم توحيد المؤشرات غير المتطابقة معًا

ضرب المصفوفة باستخدام كائنات DataFrame أو سلسلة

أخرى: DataFrame أو سلسلة

dot_product: DataFrame أو سلسلة

إرجاع كائن جديد مع إزالة التسميات في المحور المطلوب.

تسميات: تسمية واحدة أو قائمة تشبه فهرس أو تسميات العمود لإسقاطها. المحور: int أو اسم المحور سواء كان سيتم إسقاط التسميات من الفهرس (0 / "الفهرس") أو الأعمدة (1 / "الأعمدة"). الفهرس ، الأعمدة: تسمية واحدة أو قائمة تشبه

بديل لتحديد المحور (تسميات ، المحور = 1 مكافئ للأعمدة = تسميات).

سيؤدي تحديد كل من التسميات والفهرس أو الأعمدة إلى رفع ValueError.

Drop_duplicates ( مجموعة فرعية = لا شيء, احتفظ = 'الأول', inplace = خطأ ) ¶

قم بإرجاع DataFrame مع إزالة الصفوف المكررة ، بشكل اختياري مع مراعاة أعمدة معينة فقط

  • أولاً: إسقاط التكرارات باستثناء التكرارات الأولى.
  • أخيرًا: قم بإسقاط التكرارات باستثناء آخر تكرار.
  • خطأ: أسقط جميع التكرارات.

إرجاع كائن مع تسميات على محور معين تم حذفه حيث تكون أي من البيانات أو كلها مفقودة بالتناوب

  • أي: في حالة وجود أي من قيم NA ، قم بإسقاط هذا التصنيف
  • الكل: إذا كانت جميع القيم NA ، فقم بإسقاط هذا التصنيف

قم بإسقاط الأعمدة حيث تكون جميع العناصر نان:

قم بإسقاط الأعمدة حيث يكون أي عنصر من العناصر nan

قم بإسقاط الصفوف حيث تكون جميع العناصر nan (لا يوجد صف لإسقاطه ، لذلك يبقى df كما هو):

احتفظ فقط بالصفوف التي تحتوي على قيمتين غير نا على الأقل:

قم بإرجاع الأنواع الموجودة في هذا الكائن.

مكرر ( مجموعة فرعية = لا شيء, احتفظ = 'الأول' ) ¶

إرجاع السلسلة المنطقية التي تشير إلى صفوف مكررة ، مع مراعاة أعمدة معينة اختياريًا فقط

  • أولاً: وضع علامة "صواب" على التكرارات باستثناء التكرار الأول.
  • أخيرًا: وضع علامة على التكرارات على أنها صحيحة باستثناء آخر تكرار.
  • خطأ: ضع علامة على جميع التكرارات على أنها صحيحة.

صحيح إذا كان NDFrame فارغًا تمامًا [لا توجد عناصر] ، مما يعني أن أيًا من المحاور بطول 0.

إذا كان NDFrame يحتوي على NaNs فقط ، فإنه لا يزال لا يعتبر فارغًا. انظر المثال أدناه.

مثال على DataFrame فارغ فعلي. لاحظ أن الفهرس فارغ:

إذا كان لدينا NaNs فقط في DataFrame الخاص بنا ، فلن يتم اعتباره فارغًا! سنحتاج إلى إسقاط NaNs لجعل DataFrame فارغًا:

غلاف لطرق المقارنة المرنة مكافئ

الإشارة إلى ما إذا كانت الأشكال الهندسية الأساسية والمقارنة من نفس نوع الشكل وتحدد نفس مجموعة النقاط في المستوى. هذه مقارنة ثنائية الأبعاد يتم تجاهل قيم M و Z فقط. المعلمات:

قم بتقييم تعبير في سياق مثيل DataFrame الذي تم استدعاءه.

expr: string سلسلة التعبير المطلوب تقييمها. inplace: منطقي ، افتراضي خطأ

إذا كان التعبير يحتوي على مهمة ، ما إذا كان سيتم تنفيذ العملية في المكان وتغيير DataFrame الحالي أم لا. خلاف ذلك ، يتم إرجاع DataFrame جديد.

ret: كائن ndarray أو scalar أو pandas

pandas.DataFrame.query pandas.DataFrame.assign pandas.eval

لمزيد من التفاصيل ، راجع وثائق واجهة برمجة التطبيقات لـ Eval (). للحصول على أمثلة مفصلة ، راجع تحسين الأداء باستخدام Eval.

يوفر وظائف مرجحة أسية

حدد عامل التنعيم مباشرة ،

مهملة منذ الإصدار 0.18.0: التردد لتتوافق مع الإحصاء قبل الحوسبة

نافذة مصنفة فرعية لعملية معينة

يجب تقديم واحد بالضبط من مركز الكتلة ، والامتداد ، ونصف العمر ، وألفا. القيم المسموح بها والعلاقة بين المعلمات محددة في أوصاف المعلمات أعلاه ، انظر الرابط في نهاية هذا القسم للحصول على شرح مفصل.

تُستخدم الكلمة الأساسية التكرار لمطابقة بيانات السلاسل الزمنية للتردد المحدد عن طريق إعادة تشكيل البيانات. يتم ذلك باستخدام المعلمات الافتراضية لـ resample () (أي باستخدام المتوسط).

عندما يكون الضبط صحيحًا (افتراضيًا) ، يتم حساب المتوسطات الموزونة باستخدام الأوزان (1-alpha) ** (n-1) ، (1-alpha) ** (n-2) ، ... ، 1-alpha ، 1.

عندما يكون الضبط خطأ ، يتم حساب المتوسطات الموزونة بشكل متكرر على النحو التالي: weighted_average [0] = arg [0] weighted_average [i] = (1-alpha) * weighted_average [i-1] + alpha * arg [i].

عندما تكون ignore_na خطأ (افتراضي) ، تعتمد الأوزان على المواضع المطلقة. على سبيل المثال ، أوزان x و y المستخدمة في حساب المتوسط ​​المرجح النهائي لـ [x ، بلا ، y] هي (1-alpha) ** 2 و 1 (إذا كان الضبط صحيحًا) ، و (1-alpha) ** 2 و alpha (إذا كان الضبط خطأ).

عندما تكون ignore_na صحيحة (إعادة إنتاج سلوك ما قبل 0.15.0) ، تعتمد الأوزان على المواضع النسبية. على سبيل المثال ، أوزان x و y المستخدمة في حساب المتوسط ​​المرجح النهائي لـ [x ، بلا ، y] هي 1-alpha و 1 (إذا كان الضبط صحيحًا) ، و 1-alpha و alpha (إذا كان الضبط خطأ).

توسيع ( min_periods = 1, التكرار = لا شيء, المركز = خطأ, المحور = 0 ) ¶

يوفر تحولات موسعة.

موقوف منذ الإصدار 0.18.0: التردد لمطابقة البيانات قبل حساب الإحصاء. محدد كسلسلة تردد أو كائن DateOffset.

المحور: int أو string ، الافتراضي 0

نافذة مصنفة فرعية لعملية معينة

بشكل افتراضي ، يتم تعيين النتيجة على الحافة اليمنى من النافذة. يمكن تغيير هذا إلى وسط النافذة عن طريق تحديد المركز = صحيح.

تُستخدم الكلمة الأساسية التكرار لمطابقة بيانات السلاسل الزمنية للتردد المحدد عن طريق إعادة تشكيل البيانات. يتم ذلك باستخدام المعلمات الافتراضية لـ resample () (أي باستخدام المتوسط).

مدى الهندسة

يملأ ( المحور = لا شيء, inplace = خطأ, الحد = لا شيء, هبوط = لا شيء ) ¶

مرادف DataFrame.fillna (الطريقة = 'ffill')

فيلنا ( القيمة = لا شيء, الطريقة = لا شيء, المحور = لا شيء, inplace = خطأ, الحد = لا شيء, هبوط = لا شيء, ** kwargs ) ¶

املأ قيم NA / NaN باستخدام الطريقة المحددة

القيمة: قيمة قياسية ، أو ديكت ، أو متسلسلة ، أو قيمة إطار بيانات لاستخدامها لملء الثقوب (على سبيل المثال 0) ، بالتناوب ديكت / سلسلة / إطار بيانات للقيم التي تحدد القيمة التي يجب استخدامها لكل فهرس (لسلسلة) أو عمود (لإطار بيانات) . (لن يتم ملء القيم غير الموجودة في dict / Series / DataFrame). لا يمكن أن تكون هذه القيمة قائمة. الطريقة: <'backfill'، 'bfill'، 'pad'، 'ffill'، None>، افتراضي لا توجد طريقة لاستخدامها لملء الثقوب في لوحة / ملء السلسلة المعاد فهرستها: نشر آخر ملاحظة صالحة للأمام إلى الردم / الملء الصحيح التالي: الاستخدام الملاحظة التالية صالحة لسد الفجوة

المحور: <0 أو "الفهرس" ، 1 أو "الأعمدة"> inplace: منطقي ، افتراضي خطأ

استبدل جميع عناصر NaN بالأصفار.

يمكننا أيضًا نشر القيم غير الفارغة للأمام أو للخلف.

استبدل جميع عناصر NaN في العمود "A" و "B" و "C" و "D" بالأرقام 0 و 1 و 2 و 3 على التوالي.

استبدل عنصر NaN الأول فقط.

اضبط صفوف أو أعمدة إطار البيانات وفقًا للتسميات الموجودة في الفهرس المحدد.

لاحظ أن هذا الروتين لا يقوم بتصفية إطار البيانات على محتوياته. يتم تطبيق المرشح على تسميات الفهرس.

العناصر: قائمة تشبه قائمة محور المعلومات المراد تقييدها (يجب ألا تكون جميعها موجودة) مثل: string احتفظ بمحور المعلومات حيث "arg in col == True" regex: string (تعبير عادي) احتفظ بمحور المعلومات باستخدام re.search (regex ، col) == المحور الحقيقي: int أو اسم محور السلسلة المحور المراد التصفية عليه. بشكل افتراضي ، هذا هو محور المعلومات ، "الفهرس" للسلسلة ، "الأعمدة" لإطار البيانات

نفس نوع كائن الإدخال

يتم فرض معلمات العناصر مثل و regex لتكون حصرية بشكل متبادل.

يتم تعيين المحور افتراضيًا على محور المعلومات الذي يتم استخدامه عند الفهرسة باستخدام [].

طريقة ملائمة لتعيين الفترات الأولية لبيانات السلاسل الزمنية بناءً على إزاحة التاريخ.

الإزاحة: سلسلة ، DateOffset ، dateutil.relativedelta

ts.first ("10D") - & gt أول 10 أيام

أول نقطة إحداثيات في الهندسة.

مؤشر الإرجاع لأول قيمة غير NA / خالية.

إذا كانت جميع العناصر غير NA / null ، يتم إرجاع None. تقوم أيضًا بإرجاع بلا لفراغ DataFrame.

فلورديف ( آخر, المحور = "أعمدة", المستوى = لا شيء, fill_value = لا شيء ) ¶

تقسيم صحيح لإطار البيانات وغيره ، من ناحية العناصر (عامل ثنائي floordiv).

مكافئ لـ dataframe // other ، ولكن مع دعم لاستبدال fill_value عن البيانات المفقودة في أحد المدخلات.

أخرى: متسلسلة أو DataFrame أو محور ثابت:

سيتم توحيد المؤشرات غير المتطابقة معًا

from_csv ( طريق, رأس = 0, sep = ', ', index_col = 0, parse_dates = صحيح, ترميز = لا شيء, tupleize_cols = لا شيء, infer_datetime_format = خطأ ) ¶

قراءة ملف CSV (مهمل ، يرجى استخدام pandas.read_csv () بدلاً من ذلك).

يفضل استخدام pandas.read_csv () الأكثر قوة لمعظم الأغراض العامة ، ولكن from_csv يجعل رحلة الذهاب والإياب سهلة من وإلى ملف (المقابل الدقيق لـ to_csv) ، خاصةً مع DataFrame لبيانات السلاسل الزمنية.

تختلف هذه الطريقة فقط عن طريقة pandas المفضلة .read_csv () في بعض الإعدادات الافتراضية:

  • index_col هو 0 بدلاً من لا شيء (خذ العمود الأول كمؤشر افتراضيًا)
  • parse_dates هي True بدلاً من False (حاول تحليل الفهرس كتاريخ ووقت افتراضيًا)

لذلك يمكن استبدال pd.DataFrame.from_csv (مسار) بـ pd.read_csv (المسار ، index_col = 0 ، parse_dates = True).

المسار: مسار ملف السلسلة أو مقبض الملف / رأس StringIO: int ، افتراضي 0

ثابتة from_df ( مدافع, address_column = 'العنوان', المكود الجغرافي = لا شيء ) ¶

ترجع SpatialDataFrame من إطار بيانات بعمود عنوان. المدخلات:

ملاحظة: سيتم استهلاك الأرصدة للتشفير_الجمعي ، من نظام المعلومات الجغرافية الذي ينتمي إليه المشفر الجغرافي.

from_dict ( البيانات, أورينت = "أعمدة", نوع dtype = لا شيء ) ¶

بناء DataFrame من ديكت من مصفوفة مثل أو إملاءات

البيانات: dict أو التوجيه: <"الأعمدة" ، "الفهرس"> ، "الأعمدة" الافتراضية "اتجاه" البيانات. إذا كانت مفاتيح الأمر الذي تم تمريره يجب أن تكون أعمدة إطار البيانات الناتج ، مرر "الأعمدة" (افتراضي). وإلا إذا كان يجب أن تكون المفاتيح عبارة عن صفوف ، فقم بتمرير "index". dtype: dtype ، افتراضي لا شيء نوع البيانات لإجبارها ، وإلا استنتج

ثابتة from_featureclass ( اسم الملف, ** kwargs ) ¶

ترجع SpatialDataFrame من فئة المعالم. المدخلات:

اقرأ من المتجر ، وأغلقه إذا فتحناه

استرجع كائن الباندا المخزن في ملف ، بناءً على معايير المكان

path_or_buf: مسار (سلسلة) أو مخزن مؤقت أو كائن مسار (pathlib.Path أو

py._path.local.LocalPath) للقراءة منه

الجديد في الإصدار 0.19.0: دعم pathlib و py.path.

حيث: قائمة كائنات المصطلح (أو القابلة للتحويل) ، البداية الاختيارية: اختياري ، عدد صحيح (الافتراضيات إلى لا شيء) ، رقم الصف للبدء

مكرر: اختياري ، منطقي ، إرجاع مكرر ، افتراضي False chunksize: اختياري ، nrows للتضمين في التكرار ، إرجاع مكرر

from_items ( العناصر, أعمدة = لا شيء, أورينت = "أعمدة" ) ¶

تحويل (مفتاح ، قيمة) أزواج إلى DataFrame. ستكون المفاتيح هي مؤشر المحور (عادةً ما تكون الأعمدة ، ولكنها تعتمد على الاتجاه المحدد). يجب أن تكون القيم عبارة عن صفائف أو سلسلة.

العناصر: تسلسل أزواج (مفتاح ، قيمة) ، يجب أن تكون القيم عبارة عن صفائف أو سلسلة. الأعمدة: تسلسل تسميات الأعمدة ، اختياري يجب تمريره إذا كان الاتجاه = "الفهرس". التوجيه: <"الأعمدة" ، "الفهرس"> ، "الأعمدة" الافتراضية ، "اتجاه" البيانات. إذا كانت مفاتيح الإدخال تتوافق مع تسميات الأعمدة ، فمرر "الأعمدة" (افتراضي). وإلا إذا كانت المفاتيح تتوافق مع الفهرس ، فمرر "الفهرس".

ترجع SpatialDataFrame من FeatureLayer أو Table object. المدخلات:

إرجاع SpatialDataFrame للخدمات ذات الهندسة وإطار بيانات Panda لخدمات الجدول.

from_records ( البيانات, الفهرس = لا شيء, استبعاد = لا شيء, أعمدة = لا شيء, coerce_float = خطأ, nrows = لا شيء ) ¶

تحويل منظم أو سجل ndarray إلى DataFrame

البيانات: ndarray (نوع هيكلي) ، قائمة مجموعات ، أو ديكت ، أو فهرس DataFrame: سلسلة ، قائمة الحقول ، مصفوفة تشبه

قم بإرجاع الأنواع (إشارة إلى التباين / الكثافة والنوع) في هذا الكائن.

غلاف لطرق المقارنة المرنة ge

ينشئ هندسة مبسطة جديدة باستخدام أقصى تفاوت محدد للإزاحة.

ترجع مدى إطار البيانات المكانية

الحصول على / تعيين البيانات الهندسية لـ SpatialDataFrame

نوع الهندسة: مضلع ، متعدد الخطوط ، نقطة ، متعدد النقاط ، متعدد النقاط ، بُعد ، أو تعليق توضيحي

الحصول على عنصر من كائن لمفتاح معين (عمود DataFrame ، شريحة لوحة ، إلخ). ترجع القيمة الافتراضية إذا لم يتم العثور عليها.

القيمة: نوع العناصر الموجودة في الكائن

تُرجع مساحة المعلم باستخدام نوع القياس.

البيانات الجغرافية على السطح ثنائي الأبعاد (بمعنى آخر ، لن تأخذ في الاعتبار انحناء الأرض). يمكن اختيار أنواع القياس GEODESIC و GREAT_ELLIPTIC و LOXODROME و PRESERVE_SHAPE كبديل ، إذا رغبت في ذلك.

قم بإرجاع عدد أنواع dtypes في هذا الكائن.

قم بإرجاع عدد ftypes في هذا الكائن.

تُرجع طول المعلم باستخدام نوع القياس.

البيانات الجغرافية على السطح ثنائي الأبعاد (بمعنى آخر ، لن تأخذ في الاعتبار انحناء الأرض). يمكن اختيار أنواع القياس GEODESIC و GREAT_ELLIPTIC و LOXODROME و PRESERVE_SHAPE كبديل ، إذا رغبت في ذلك.

العدادات | قدم | بوصة | كيلومترات | مترات | أميال | ملليمترات | NAUTICALMILES | ساحات

تُرجع مصفوفة كائنات نقطية لجزء معين من الهندسة أو مصفوفة تحتوي على عدد من المصفوفات ، واحدة لكل جزء.

استرداد قيمة واحدة بسرعة في العمود والفهرس الذي تم تمريره

مهملة منذ الإصدار 0.21.0.

الرجاء استخدام ملحقات .at [] أو .iat [].

الفهرس: تسمية الصف العمود: تسمية العمود يمكن الحصول عليها: تفسير الفهرس / العمود كمفهرسات ، افتراضي خطأ

نفس القيم (لكنها تتعامل مع التحويلات المتناثرة)

قم بتجميع المتسلسلات باستخدام معين (دالة ديكت أو مفتاح ، قم بتطبيق وظيفة معينة على المجموعة ، وإرجاع النتيجة كسلسلة) أو عن طريق سلسلة من الأعمدة.

بواسطة: تعيين ، وظيفة ، str ، أو تكرارية تستخدم لتحديد المجموعات للمجموعة. إذا كانت by دالة ، يتم استدعاؤها على كل قيمة في فهرس الكائن. إذا تم تمرير دكت أو سلسلة ، فسيتم استخدام سلسلة أو قيم ديكت لتحديد المجموعات (تتم محاذاة قيم السلسلة أولاً ، انظر طريقة .align ()). إذا تم تمرير ndarray ، يتم استخدام القيم كما هي لتحديد المجموعات. يمكن تمرير str أو قائمة strs إلى مجموعة بواسطة الأعمدة في self

المحور: int ، المستوى الافتراضي 0: int ، اسم المستوى ، أو تسلسل من هذا القبيل ، الافتراضي لا شيء

DataFrame مع فهرس هرمي

غلاف لطرق المقارنة المرنة GT

n: int ، افتراضي 5 عدد الصفوف المراد تحديدها. obj_head: نوع المتصل الصفوف n الأولى من كائن المتصل. اصمت ( البيانات, العمود = لا شيء, بواسطة = لا شيء, الشبكة = صحيح, xlabelsize = بلا, xrot = لا شيء, ylabelsize = لا شيء, yrot = لا شيء, الفأس = لا شيء, sharex = خطأ, Sharey = خطأ, حجم التين = لا شيء, التخطيط = لا شيء, صناديق = 10, ** كودس ) ¶

ارسم مدرج تكراري لسلسلة DataFrame باستخدام matplotlib / pylab.

البيانات: عمود DataFrame: سلسلة أو تسلسل

الفأس: كائن محاور matplotlib ، افتراضي لا شيء sharex: منطقي ، افتراضي صحيح إذا كان الفأس لا شيء آخر خطأ

سلسلة محددة بمسافة من أزواج إحداثيات المستطيل المحدب بدن السفينة.

موصّل عددي لموقع عدد صحيح سريع.

على غرار iloc ، يوفر iat عدد صحيح عمليات البحث القائمة. يمكنك أيضًا تعيين باستخدام هذه المفهرسات.

مؤشر إرجاع التواجد الأول للحد الأقصى على المحور المطلوب. يتم استبعاد القيم غير المتوفرة / القيم الخالية.

المحور: <0 أو "الفهرس" ، 1 أو "الأعمدة"> ، القيمة الافتراضية 0 0 أو "الفهرس" للصفوف ، 1 أو "الأعمدة" لتخطي الأعمدة: منطقي ، افتراضي صحيح استبعاد القيم غير الصالحة / القيم الخالية. إذا كان الصف / العمود بأكمله هو NA ، فستكون النتيجة هي الفهرس الأول.

هذه الطريقة هي نسخة DataFrame من ndarray.argmax.

مؤشر إرجاع التواجد الأول للحد الأدنى على المحور المطلوب. يتم استبعاد القيم غير المتوفرة / القيم الخالية.

المحور: <0 أو "الفهرس" ، 1 أو "الأعمدة"> ، القيمة الافتراضية 0 0 أو "الفهرس" للصفوف ، 1 أو "الأعمدة" لتخطي الأعمدة: منطقي ، افتراضي صحيح استبعاد القيم غير الصالحة / القيم الخالية. إذا كان الصف / العمود بأكمله هو NA ، فستكون النتيجة NA

هذه الطريقة هي نسخة DataFrame من ndarray.argmin.

فهرسة تستند إلى عدد صحيح بحت للاختيار حسب الموضع.

.iloc [] يعتمد أساسًا على الموضع الصحيح (من 0 إلى الطول -1 للمحور) ، ولكن يمكن استخدامه أيضًا مع مصفوفة منطقية.

  • عدد صحيح ، على سبيل المثال 5.
  • قائمة أو مجموعة من الأعداد الصحيحة ، على سبيل المثال [4 ، 3 ، 0].
  • كائن شريحة مع ints ، على سبيل المثال 1: 7.
  • مصفوفة منطقية.
  • دالة قابلة للاستدعاء مع وسيطة واحدة (سلسلة الاستدعاء أو DataFrame أو اللوحة) وتعيد إخراجًا صالحًا للفهرسة (واحد مما سبق)

سيقوم .iloc برفع قيمة IndexError إذا كان المفهرس المطلوب خارج الحدود ، باستثناء شريحة المفهرسات التي تسمح بالفهرسة خارج الحدود (وهذا يتوافق مع python / numpy شريحة دلالات).

شاهد المزيد في التحديد حسب الوظيفة

محاولة استنتاج أنواع أفضل لأعمدة الكائنات.

يحاول إجراء تحويل بسيط لأعمدة من نوع كائن ، مع ترك الأعمدة غير الكائن وغير القابلة للتحويل دون تغيير. قواعد الاستدلال هي نفسها أثناء إنشاء سلسلة / DataFrame العادي.

pandas.to_datetime: تحويل الوسيطة إلى datetime. pandas.to_timedelta: تحويل الوسيطة إلى timedelta. pandas.to_numeric: تحويل الوسيطة إلى نوع رقمي R.

تم التحويل: نفس نوع كائن الإدخال

ملخص موجز لإطار البيانات.

مطول: ، اختياري سواء لطباعة الملخص الكامل. لا شيء يتبع إعداد display.max_info_columns. يتجاوز صواب أو خطأ إعداد display.max_info_columns.

buf: مخزن مؤقت قابل للكتابة ، يتم تعيينه افتراضيًا على sys.stdout max_cols: int ، افتراضي لا شيء

ما إذا كان سيتم إظهار الأعداد غير الفارغة أم لا

  • إذا لم يكن هناك شيء ، فقم بإظهار ما إذا كان الإطار أصغر من max_info_rows و max_info_columns.
  • إذا كان هذا صحيحًا ، فقم بإظهار التهم دائمًا.
  • إذا كان خطأ ، فلا تظهر التهم.

أدخل العمود في DataFrame في الموقع المحدد.

يرفع ValueError إذا كان العمود موجودًا بالفعل في DataFrame ، ما لم يتم تعيين allow_duplicates إلى True.

loc: int فهرس الإدراج. يجب التحقق من عمود 0 & lt = loc & lt = len (أعمدة): سلسلة أو رقم أو تسمية كائن قابل للتجزئة للعمود المُدرج

القيمة: int ، أو السلسلة ، أو المصفوفة المشابهة allow_duplicates: bool ، اختيارية

تحقق ( الطريقة = "خطي", المحور = 0, الحد = لا شيء, inplace = خطأ, Limit_direction = "إعادة توجيه", هبوط = لا شيء, ** kwargs ) ¶

أقحم القيم وفقًا للطرق المختلفة.

يرجى ملاحظة أن الطريقة الوحيدة = "الخطية" هي المدعومة لإطارات / سلاسل البيانات ذات المؤشرات المتعددة.

  • "خطي": تجاهل الفهرس والتعامل مع القيم على أنها مسافات متساوية. هذه هي الطريقة الوحيدة المدعومة في MultiIndexes. إفتراضي
  • "الوقت": يعمل الاستيفاء على البيانات اليومية وذات الدقة الأعلى لاستيفاء طول الفاصل الزمني المحدد
  • "الفهرس" ، "القيم": استخدم القيم العددية الفعلية للمؤشر
  • يتم تمرير "الأقرب" ، "صفر" ، "سلينير" ، "تربيعي" ، "مكعب" ، "ثنائي المركز" ، "متعدد الحدود" إلى scipy.interpolate.interp1d. يتطلب كل من "متعدد الحدود" و "خدد" تحديد أمر (int) ، على سبيل المثال df.interpolate (الطريقة = "كثيرة الحدود" ، الترتيب = 4). تستخدم هذه القيم العددية الفعلية للفهرس.
  • "krogh" ، و "القطعة متعددة الحدود" ، و "spline" ، و "pchip" و "akima" كلها أغلفة حول طرق الاستيفاء scipy للأسماء المتشابهة. تستخدم هذه القيم العددية الفعلية للفهرس. لمزيد من المعلومات حول سلوكهم ، راجع وثائق scipy ووثائق البرنامج التعليمي
  • تشير "from_derivatives" إلى BPoly.from_derivatives التي تحل محل طريقة الاستيفاء "متعددة الحدود" في scipy 0.18

الجديد في الإصدار 0.18.1: تمت إضافة دعم لطريقة "akima" تمت إضافة طريقة الإقحام "from_derivatives" التي تحل محل "القطعة متعددة الحدود" في scipy 0.18 المتوافقة مع الإصدارات السابقة مع scipy & lt 0.18

إذا تم تحديد الحد ، فسيتم ملء NaNs المتتالية في هذا الاتجاه.

kwargs: وسيطات الكلمات الرئيسية لتمريرها إلى دالة الاستيفاء.

سلسلة أو DataFrame من نفس الشكل محرف في NaNs

تُنشئ هندسة تمثل التقاطع الهندسي بين شكلي إدخال هندسي. يمكن استخدام قيم أبعاد مختلفة لإنشاء أنواع مختلفة من الأشكال. التقاطع بين شكلين من نفس نوع الشكل هو شكل هندسي يحتوي فقط على مناطق التداخل بين الأشكال الهندسية الأصلية.

1- هندسة صفرية الأبعاد (نقطة أو متعددة النقاط). 2- هندسة أحادية البعد (متعدد الخطوط). 4- هندسة ثنائية الأبعاد (مضلع).

إرجاع صحيح لكل هندسة فارغة ، خطأ لغير فارغ

صحيح ، إذا كان عدد أجزاء الهندسة أكبر من 1

إرجاع DataFrame المنطقي الذي يوضح ما إذا كان كل عنصر في DataFrame متضمنًا في قيم.

القيم: iterable أو Series أو DataFrame أو Dictionary ستكون النتيجة صحيحة فقط في الموقع إذا كانت جميع التسميات متطابقة. إذا كانت القيم عبارة عن سلسلة ، فهذا هو الفهرس. إذا كانت القيم عبارة عن قاموس ، فيجب أن تكون المفاتيح هي أسماء الأعمدة ، والتي يجب أن تتطابق. إذا كانت القيم عبارة عن DataFrame ، فيجب أن تتطابق تسميات الفهرس والأعمدة.

عندما تكون القيم عبارة عن سلسلة أو DataFrame:

قم بإرجاع كائن منطقي بنفس الحجم للإشارة إلى ما إذا كانت القيم NA.

DataFrame.notna: المعكوس المنطقي لـ isna DataFrame.isnull: الاسم المستعار لإسنا: إسنا ذو المستوى الأعلى

قم بإرجاع كائن منطقي بنفس الحجم للإشارة إلى ما إذا كانت القيم NA.

DataFrame.notna: المعكوس المنطقي لـ isna DataFrame.isnull: الاسم المستعار لإسنا: إسنا ذو المستوى الأعلى

تكرار أزواج (اسم العمود ، السلسلة).

iterrows: التكرار عبر صفوف DataFrame كأزواج (فهرس ، سلسلة). itertuples: التكرار عبر صفوف DataFrame كمضاعفات مسماة للقيم.

تكرار أزواج (اسم العمود ، السلسلة).

iterrows: التكرار عبر صفوف DataFrame كأزواج (فهرس ، سلسلة). itertuples: التكرار عبر صفوف DataFrame كمضاعفات مسماة للقيم.

كرر عبر صفوف DataFrame كأزواج (فهرس ، سلسلة).

نظرًا لأن iterrows تُرجع سلسلة لكل صف ، فإنها تقوم بذلك ليس الحفاظ على أنواع dtypes عبر الصفوف (يتم الاحتفاظ بـ dtypes عبر أعمدة DataFrames). على سبيل المثال،

للحفاظ على dtypes أثناء التكرار على الصفوف ، من الأفضل استخدام itertuples () الذي يعرض أسماءً مضاعفة للقيم والتي تكون عمومًا أسرع من التكرارات.

يجب أبدا تعديل شيء ما تكرره. هذا غير مضمون للعمل في جميع الحالات. اعتمادًا على أنواع البيانات ، يقوم المكرر بإرجاع نسخة وليس طريقة عرض ، ولن يكون للكتابة عليها أي تأثير.

itertuples: التكرار عبر صفوف DataFrame كمضاعفات مسماة للقيم. العناصر التكرارية: كرر أزواج (اسم العمود ، السلسلة).

تكرارات ( الفهرس = صحيح, الاسم = "الباندا" ) ¶

كرر عبر صفوف DataFrame على شكل أسماء مضاعفة ، مع قيمة الفهرس كعنصر أول في المجموعة.

index: منطقي ، افتراضي True If True ، أعد الفهرس كعنصر أول في المجموعة.name: string ، افتراضي "Pandas" اسم المجموعات التي تم إرجاعها المسماة أو None لإرجاع المجموعات العادية.

ستتم إعادة تسمية أسماء الأعمدة إلى أسماء موضعية إذا كانت معرّفات Python غير صالحة أو مكررة أو تبدأ بشرطة سفلية. مع وجود عدد كبير من الأعمدة (& gt255) ، يتم إرجاع مجموعات منتظمة.

iterrows: التكرار عبر صفوف DataFrame كأزواج (فهرس ، سلسلة). العناصر التكرارية: كرر أزواج (اسم العمود ، السلسلة).

مفهرس أساسه موقع التسمية ، مع وضع احتياطي صحيح.

.ix [] يدعم الوصول المعتمد على التسمية والأعداد الصحيحة المختلطة. يعتمد بشكل أساسي على التسمية ، ولكنه سيعود إلى الوصول الموضعي لعدد صحيح ما لم يكن المحور المقابل من نوع عدد صحيح.

.ix هو المفهرس الأكثر عمومية وسيدعم أي من المدخلات في .loc و .iloc. .ix يدعم أيضًا مخططات تسمية الفاصلة العائمة. يعتبر .ix مفيدًا بشكل استثنائي عند التعامل مع الفهارس الهرمية المختلطة القائمة على الموضع والتسمية.

ومع ذلك ، عندما يعتمد المحور على عدد صحيح ، يتم دعم الوصول المستند إلى التسمية فقط وليس الوصول الموضعي. وبالتالي ، في مثل هذه الحالات ، من الأفضل عادةً أن تكون صريحًا وتستخدم .iloc أو .loc.

شاهد المزيد في الفهرسة المتقدمة.

انضم إلى الأعمدة مع DataFrame الأخرى إما في الفهرس أو في عمود مفتاح. انضم بفاعلية إلى كائنات DataFrame متعددة عن طريق الفهرس مرة واحدة عن طريق تمرير قائمة.

أخرى: يجب أن تكون DataFrame أو سلسلة مع مجموعة حقول الاسم أو قائمة DataFrame Index مشابهة لأحد الأعمدة الموجودة في هذا العمود. إذا تم تمرير سلسلة ، فيجب تعيين سمة الاسم الخاصة بها ، وسيتم استخدامها كاسم عمود في DataFrame الناتج المرتبط على: اسم العمود ، أو مجموعة / قائمة أسماء الأعمدة ، أو عمود (أعمدة) يشبه الصفيف في المتصل للانضمام إلى الفهرس في مكان آخر ، أو ينضم إلى index-on-index. إذا تم إعطاء أعمدة متعددة ، يجب أن يحتوي DataFrame الذي تم تمريره على مؤشر متعدد. يمكن تمرير مصفوفة كمفتاح ربط إذا لم تكن موجودة بالفعل في DataFrame المتصل. مثل عملية Excel VLOOKUP كيف: <"left" ، "right" ، "الخارجي" ، "الداخلية"> ، الافتراضي: "اليسار"

كيفية التعامل مع تشغيل الكائنين.

  • على اليسار: استخدم فهرس إطار الاستدعاء (أو العمود إذا تم تحديد تشغيل)
  • right: استخدم فهرس الإطارات الأخرى
  • خارجي: شكل اتحادًا من فهرس إطار الاستدعاء (أو العمود إذا تم تحديده) مع فهرس إطار آخر ، وفرزه معجميًا
  • داخلي: نموذج تقاطع فهرس إطار الاستدعاء (أو العمود إذا تم تحديده) مع فهرس إطار آخر ، مع الحفاظ على ترتيب مؤشر الاستدعاء

لا يتم دعم خيارات on و lsuffix و rsuffix عند تمرير قائمة كائنات DataFrame

انضم إلى DataFrames باستخدام فهارسها.

إذا أردنا الانضمام باستخدام الأعمدة الرئيسية ، فنحن بحاجة إلى تعيين المفتاح ليكون الفهرس في كل من المتصل وغيره. سيكون لـ DataFrame المنضم مفتاحًا كفهرس خاص به.

هناك خيار آخر للانضمام باستخدام الأعمدة الرئيسية وهو استخدام المعلمة on. يستخدم DataFrame.join دائمًا فهرس الآخرين ولكن يمكننا استخدام أي عمود في المتصل. تحافظ هذه الطريقة على فهرس المتصل الأصلي في النتيجة.

DataFrame.merge: لعمليات العمود (الأعمدة) على الأعمدة

احصل على "محور المعلومات" (انظر الفهرسة للمزيد)

هذا فهرس للسلسلة وأعمدة DataFrame والمحور الرئيسي للوحة.

كورت ( المحور = لا شيء, skipna = لا شيء, المستوى = لا شيء, numeric_only = لا شيء, ** kwargs ) ¶

إرجاع التفرطح غير المتحيز على المحور المطلوب باستخدام تعريف فيشر للتفرطح (التفرطح الطبيعي = = 0.0). تطبيع بواسطة N-1

المحور: skipna: منطقي ، افتراضي صحيح

kurt: سلسلة أو DataFrame (إذا تم تحديد المستوى)

التفرطح ( المحور = لا شيء, skipna = لا شيء, المستوى = لا شيء, numeric_only = لا شيء, ** kwargs ) ¶

إرجاع التفرطح غير المتحيز على المحور المطلوب باستخدام تعريف فيشر للتفرطح (التفرطح الطبيعي = = 0.0). تطبيع بواسطة N-1

المحور: skipna: منطقي ، افتراضي صحيح

kurt: سلسلة أو DataFrame (إذا تم تحديد المستوى)

النقطة التي يقع عندها الملصق. يقع LabelPoint دائمًا داخل الميزة أو عليها.

طريقة ملائمة لتعيين الفترات النهائية لبيانات السلاسل الزمنية بناءً على إزاحة التاريخ.

الإزاحة: سلسلة ، DateOffset ، dateutil.relativedelta

آخر تنسيق للميزة.

مؤشر الإرجاع لأول قيمة غير NA / خالية.

إذا كانت جميع العناصر غير NA / null ، يتم إرجاع None. تقوم أيضًا بإرجاع بلا لفراغ DataFrame.

غلاف لطرق المقارنة المرنة جنيه

طول السمة الخطية. صفر لأنواع المعالم النقطية ومتعددة النقاط.

الطول ثلاثي الأبعاد للميزة الخطية. صفر لأنواع المعالم النقطية ومتعددة النقاط.

مفهرس قائم على التسمية والموقع للاختيار حسب التسمية.

.loc [] يعتمد أساسًا على التسمية ، ولكن يمكن استخدامه أيضًا مع مصفوفة منطقية.

  • تسمية واحدة ، على سبيل المثال 5 أو "a" (لاحظ أن الرقم 5 يتم تفسيره على أنه a ضع الكلمة المناسبة من الفهرس ، و مطلقا كموقع صحيح على طول الفهرس).
  • قائمة أو مجموعة تسميات ، على سبيل المثال ["أ" ، "ب" ، "ج"].
  • كائن شريحة مع تسميات ، على سبيل المثال 'a': 'f' (لاحظ أنه على عكس شرائح الثعبان المعتادة ، على حد سواء يتم تضمين البداية والإيقاف!).
  • مصفوفة منطقية.
  • دالة قابلة للاستدعاء مع وسيطة واحدة (سلسلة الاستدعاء أو DataFrame أو اللوحة) وتعيد إخراجًا صالحًا للفهرسة (واحد مما سبق)

سيؤدي .loc إلى رفع خطأ KeyError عند عدم العثور على العناصر.

شاهد المزيد في التحديد حسب التسمية

ابحث عن ( الصفوف, col_labels ) ¶

وظيفة "الفهرسة الفاخرة" القائمة على الملصقات لإطار البيانات. بالنظر إلى صفائف متساوية الطول لتسميات الصفوف والأعمدة ، قم بإرجاع صفيف من القيم المقابلة لكل زوج (صف ، عمود).

row_labels: التسلسل تسميات الصفوف المراد استخدامها للبحث col_labels: التسلسل تسميات العمود المراد استخدامها للبحث

غلاف لطرق المقارنة المرنة LT

إرجاع متوسط ​​الانحراف المطلق لقيم المحور المطلوب

المحور: skipna: منطقي ، افتراضي صحيح

mad: سلسلة أو DataFrame (إذا تم تحديد المستوى)

قناع ( الشرط, أخرى = نان, inplace = خطأ, المحور = لا شيء, المستوى = لا شيء, الأخطاء = "زيادة", try_cast = خطأ, lift_on_error = لا شيء ) ¶

قم بإرجاع كائن من نفس الشكل مثل self وتكون إدخالاته المقابلة من self حيث يكون cond خطأ وغير ذلك من الآخر.

cond: إطار منطقي NDFrame ، يشبه المصفوفة ، أو قابل للاستدعاء

عندما يكون الشرط خطأ ، احتفظ بالقيمة الأصلية. إذا كان هذا صحيحًا ، استبدل القيمة المقابلة من الآخر. إذا كان cond قابل للاستدعاء ، يتم حسابه على NDFrame ويجب أن يُرجع NDFrame المنطقي أو الصفيف. يجب ألا يغير القابل للاستدعاء إدخال NDFrame (على الرغم من أن الباندا لا تتحقق منه).

الجديد في الإصدار 0.18.1: يمكن استخدام الاستدعاء كشرط.

يتم استبدال الإدخالات حيث يكون cond هو True بالقيمة المقابلة من الأخرى. إذا كان الآخر قابلاً للاستدعاء ، يتم حسابه على NDFrame ويجب أن يُرجع العدد القياسي أو NDFrame. يجب ألا يغير القابل للاستدعاء إدخال NDFrame (على الرغم من أن الباندا لا تتحقق منه).

الجديد في الإصدار 0.18.1: يمكن استخدام الكلمة القابلة للاستدعاء كآخر.

المحور: محور المحاذاة إذا لزم الأمر ، المستوى الافتراضي بلا مستوى: مستوى المحاذاة إذا لزم الأمر ، الافتراضي لا توجد أخطاء: str ، <"رفع" ، "تجاهل"> ، الافتراضي "رفع"

  • رفع: السماح برفع الاستثناءات
  • تجاهل: قم بإلغاء الاستثناءات. عند الخطأ ، قم بإرجاع الكائن الأصلي

ما إذا كان سيتم رفع أنواع البيانات غير الصالحة (على سبيل المثال ، محاولة تحديد مكان على السلاسل)

موقوف منذ الإصدار 0.21.0.

طريقة القناع هي تطبيق للمصطلح الشرطي. لكل عنصر في DataFrame المستدعي ، إذا كانت cond هي False ، فسيتم استخدام العنصر المقابل من DataFrame الآخر.

يختلف توقيع DataFrame.where () عن numpy.where (). تقريبًا df1 حيث (m ، df2) تعادل np. حيث (m ، df1 ، df2).

لمزيد من التفاصيل والأمثلة ، راجع توثيق القناع في الفهرسة.

الأعلى ( المحور = لا شيء, skipna = لا شيء, المستوى = لا شيء, numeric_only = لا شيء, ** kwargs ) ¶ تقوم هذه الطريقة بإرجاع الحد الأقصى للقيم الموجودة في الكائن. إذا كنت تريد فهرس من الحد الأقصى ، استخدم idxmax. هذا هو المكافئ للطريقة numpy.ndarray argmax.

المحور: skipna: منطقي ، افتراضي صحيح

max: سلسلة أو DataFrame (إذا تم تحديد المستوى)

يعني ( المحور = لا شيء, skipna = لا شيء, المستوى = لا شيء, numeric_only = لا شيء, ** kwargs ) ¶

قم بإرجاع متوسط ​​قيم المحور المطلوب

المحور: skipna: منطقي ، افتراضي صحيح

يعني: سلسلة أو DataFrame (إذا تم تحديد المستوى)

قياس_على الإنترنت ( الهندسة_الثانية, as_percentage = خطأ ) ¶

يُرجع مقياسًا من نقطة بداية هذا الخط إلى نقطة in_point.

المسافة إذا كانت صحيحة ، فسيتم إرجاع المقياس كنسبة مئوية.

إرجاع متوسط ​​قيم المحور المطلوب

المحور: skipna: منطقي ، افتراضي صحيح

الوسيط: سلسلة أو DataFrame (إذا تم تحديد المستوى)

إنصهار ( id_vars = لا شيء, value_vars = لا شيء, var_name = لا شيء, value_name = 'value', col_level = بلا ) ¶

"Unpivots" وهو DataFrame من تنسيق عريض إلى تنسيق طويل ، مع ترك مجموعة متغيرات المعرف اختياريًا.

هذه الوظيفة مفيدة لتدليك DataFrame في تنسيق حيث يكون عمود واحد أو أكثر متغيرات معرف (id_vars) ، في حين أن جميع الأعمدة الأخرى ، التي تعتبر متغيرات مُقاسة (value_vars) ، تكون "غير محفزة" على محور الصف ، مع ترك عمودين فقط بدون معرف أعمدة "متغير" و "قيمة".

الإطار: DataFrame id_vars: tuple أو list أو ndarray ، اختياري

تذوب pivot_table DataFrame.pivot

يمكن تخصيص أسماء أعمدة "المتغير" و "القيمة":

إذا كان لديك أعمدة متعددة الفهارس:

استخدام الذاكرة لأعمدة DataFrame.

index: bool يحدد ما إذا كان سيتم تضمين استخدام الذاكرة لفهرس DataFrame في السلسلة التي تم إرجاعها. إذا كان الفهرس = True (الافتراضي هو False) ، فإن أول فهرس للسلسلة هو الفهرس. عميق: منطقي استبطان البيانات بعمق ، واستفسر عن أنواع الكائنات لأحجام استهلاك الذاكرة على مستوى النظام: السلسلة A مع أسماء الأعمدة كفهرس واستخدام الذاكرة للأعمدة بوحدات البايت.

لا يتضمن استخدام الذاكرة الذاكرة المستهلكة من قبل العناصر التي ليست من مكونات المصفوفة إذا كانت القيمة العميقة = خطأ

دمج ( حق, كيف = "داخلي", تشغيل = لا شيء, left_on = لا شيء, right_on = لا شيء, left_index = خطأ, right_index = خطأ, نوع = خطأ, اللواحق = ('_ x', "_y"), نسخ = صحيح, المؤشر = خطأ, تحقق من صحة = لا شيء ) ¶

دمج كائنات DataFrame بتنفيذ عملية ربط بنمط قاعدة البيانات بواسطة الأعمدة أو الفهارس.

في حالة ضم الأعمدة في الأعمدة ، يتم فهرسة DataFrame سيتم تجاهله. وإلا إذا تم ضم الفهارس في الفهارس أو الفهارس في عمود أو أعمدة ، فسيتم تمرير الفهرس.

  • على اليسار: استخدم فقط مفاتيح من الإطار الأيسر ، على غرار الصلة الخارجية اليسرى في SQL للحفاظ على ترتيب المفاتيح
  • اليمين: استخدم فقط مفاتيح من الإطار الأيمن ، على غرار الصلة الخارجية اليمنى لـ SQL للحفاظ على ترتيب المفاتيح
  • خارجي: استخدم اتحاد المفاتيح من كلا الإطارين ، على غرار مفاتيح فرز ربط خارجية كاملة SQL معجمية
  • داخلي: استخدم تقاطع المفاتيح من كلا الإطارين ، على غرار الصلة الداخلية لـ SQL مع الاحتفاظ بترتيب المفاتيح اليسرى

إذا كان صحيحًا ، يضيف عمودًا لإخراج DataFrame يسمى "_دمج" بمعلومات عن مصدر كل صف. إذا كانت السلسلة ، فسيتم إضافة العمود الذي يحتوي على معلومات عن مصدر كل صف إلى DataFrame الناتج ، وسيتم تسمية العمود بقيمة السلسلة. عمود المعلومات من النوع Categorical ويأخذ قيمة "left_only" للملاحظات التي يظهر مفتاح دمجها فقط في DataFrame "left" و "right_only" للملاحظات التي يظهر مفتاح دمجها فقط في DataFrame "right" و "كلاهما" إذا تم العثور على مفتاح دمج المراقبة في كليهما.

إذا تم تحديده ، يتحقق مما إذا كان الدمج من النوع المحدد.

  • "one_to_one" أو "1: 1": تحقق مما إذا كانت مفاتيح الدمج فريدة في مجموعات البيانات اليمنى واليسرى.
  • “one_to_many” أو “1: m”: تحقق مما إذا كانت مفاتيح الدمج فريدة في مجموعة البيانات اليسرى.
  • "many_to_one" أو "m: 1": تحقق مما إذا كانت مفاتيح الدمج فريدة في مجموعة البيانات الصحيحة.
  • "many_to_many" أو "m: m": مسموح به ، لكن لا ينتج عنه عمليات تحقق.

تجمع هذه العملية بين إطارين للبيانات في إطار بيانات واحد جديد. إذا كانت العملية تجمع بين إطارين SpatialDataFrames ، فيجب أن يتطابق geometry_type.

دقيقة ( المحور = لا شيء, skipna = لا شيء, المستوى = لا شيء, numeric_only = لا شيء, ** kwargs ) ¶ تقوم هذه الطريقة بإرجاع الحد الأدنى من القيم الموجودة في الكائن. إذا كنت تريد فهرس من الحد الأدنى ، استخدم idxmin. هذا يعادل طريقة numpy.ndarray argmin.

المحور: skipna: منطقي ، افتراضي صحيح

min: سلسلة أو DataFrame (إذا تم تحديد المستوى)

Modulo of dataframe and other، element-wise (ثنائي المشغل mod).

مكافئ لـ dataframe٪ other ، ولكن مع دعم لاستبدال fill_value عن البيانات المفقودة في أحد المدخلات.

أخرى: متسلسلة أو DataFrame أو محور ثابت:

سيتم توحيد المؤشرات غير المتطابقة معًا

الوضع ( المحور = 0, numeric_only = خطأ ) ¶

الحصول على الوضع (الأوضاع) الخاصة بكل عنصر على طول المحور المحدد. يضيف صفًا لكل وضع لكل تصنيف ، ويملأ الفجوات بـ nan.

لاحظ أنه قد تكون هناك قيم متعددة يتم إرجاعها للمحور المحدد (عندما يشترك أكثر من عنصر في الحد الأقصى للتردد) ، وهذا هو سبب إرجاع إطار البيانات. إذا كنت تريد احتساب القيم المفقودة مع الوضع في إطار البيانات df ، يمكنك فقط القيام بذلك: df.fillna (df.mode (). iloc [0])

مضاعفة إطار البيانات وغيرها ، من ناحية العناصر (عامل ثنائي مول).

مكافئ لـ dataframe * other ، ولكن مع دعم لاستبدال fill_value عن البيانات المفقودة في أحد المدخلات.

أخرى: متسلسلة أو DataFrame أو محور ثابت:

سيتم توحيد المؤشرات غير المتطابقة معًا

تتضاعف ( آخر, المحور = "أعمدة", المستوى = لا شيء, fill_value = لا شيء ) ¶

مضاعفة إطار البيانات وغيرها ، من ناحية العناصر (عامل ثنائي مول).

مكافئ لـ dataframe * other ، ولكن مع دعم لاستبدال fill_value عن البيانات المفقودة في أحد المدخلات.

أخرى: متسلسلة أو DataFrame أو محور ثابت:

سيتم توحيد المؤشرات غير المتطابقة معًا

عدد المحاور / أبعاد الصفيف

غلاف لطرق المقارنة المرنة ne

احصل على صفوف DataFrame مرتبة حسب أكبر عدد من قيم الأعمدة.

قم بإرجاع كائن منطقي بنفس الحجم للإشارة إلى ما إذا كانت القيم ليست NA.

DataFrame.isna: المعكوس المنطقي لـ notna DataFrame.notnull: الاسم المستعار لـ notna notna: المستوى الأعلى notna

قم بإرجاع كائن منطقي بنفس الحجم للإشارة إلى ما إذا كانت القيم ليست NA.

DataFrame.isna: المعكوس المنطقي لـ notna DataFrame.notnull: الاسم المستعار لـ notna notna: المستوى الأعلى notna

احصل على صفوف DataFrame مرتبة حسب n أصغر قيم الأعمدة.

سلسلة إرجاع مع عدد من الملاحظات المميزة على المحور المطلوب.

المحور: <0 أو "الفهرس" ، 1 أو "الأعمدة"> ، الافتراضي 0 dropna: منطقي ، افتراضي صحيح

يشير إلى ما إذا كان تقاطع الشكلين الهندسيين له نفس نوع الشكل كأحد الأشكال الهندسية للإدخال ولا يعادل أيًا من الأشكال الهندسية للإدخال.

عدد الأجزاء الهندسية للميزة.

pct_change ( فترات = 1, fill_method = 'وسادة', الحد = لا شيء, التكرار = لا شيء, ** kwargs ) ¶

النسبة المئوية للتغيير على عدد معين من الفترات.

الفترات: int ، الافتراضي 1 فترات التغيير لتشكيل النسبة المئوية للتغيير fill_method: str ، "pad" الافتراضية كيفية التعامل مع NAs قبل حساب النسبة المئوية للتغييرات الحد: int ، افتراضي لا شيء عدد NAs المتتالية التي يجب ملؤها قبل إيقاف التكرار: DateOffset ، timedelta ، أو سلسلة اسم مستعار إزاحة ، زيادة اختيارية للاستخدام من واجهة برمجة تطبيقات السلاسل الزمنية (على سبيل المثال "M" أو BDay ())

بشكل افتراضي ، يتم حساب النسبة المئوية للتغيير على طول المحور الأساسي: 0 ، أو الفهرس ، لـ DataFrame و 1 ، أو ثانوي للوحة. يمكنك تغيير هذا باستخدام وسيطة الكلمة الأساسية للمحور.

تطبيق func (self، * args، ** kwargs)

func: وظيفة دالة لتطبيق NDFrame. يتم تمرير args و kwargs إلى func. وبدلاً من ذلك ، تكون مجموعة (callable، data_keyword) حيث تكون data_keyword عبارة عن سلسلة تشير إلى الكلمة الأساسية للاستدعاء والتي تتوقع NDFrame. args: الحجج الموضعية الاختيارية القابلة للتكرار تم تمريرها إلى func. kwargs: تعيين ، قاموس اختياري لوسائط الكلمات الرئيسية التي تم تمريرها إلى func.

الكائن: نوع الإرجاع من func.

استخدم .pipe عند ربط الوظائف التي تتوقع كائنات السلسلة أو DataFrames أو GroupBy معًا. بدلا من الكتابة

إذا كانت لديك وظيفة تأخذ البيانات (على سبيل المثال) الوسيطة الثانية ، قم بتمرير tuple للإشارة إلى الكلمة الأساسية التي تتوقع البيانات. على سبيل المثال ، افترض أن f تأخذ بياناتها على أنها arg2:

pandas.DataFrame.apply pandas.DataFrame.applymap pandas.Series.map

محور ( الفهرس = لا شيء, أعمدة = لا شيء, القيم = لا شيء ) ¶

إعادة تشكيل البيانات (إنتاج جدول "محوري") بناءً على قيم العمود. يستخدم قيمًا فريدة من الفهرس / الأعمدة لتشكيل محاور إطار البيانات الناتج.

index: سلسلة أو كائن ، اسم عمود اختياري لاستخدامه في إنشاء فهرس إطار جديد. إذا لم يتم استخدام الفهرس الموجود. الأعمدة: سلسلة أو كائن اسم العمود المراد استخدامه لإنشاء قيم أعمدة لإطار جديد: سلسلة أو كائن ، اسم عمود اختياري لاستخدامه في تعبئة قيم الإطار الجديد. إذا لم يتم تحديدها ، فسيتم استخدام جميع الأعمدة المتبقية وستتضمن النتيجة أعمدة مفهرسة بشكل هرمي

DataFrame.pivot_table: تعميم المحور الذي يمكنه التعامل مع القيم المكررة لزوج فهرس / عمود واحد DataFrame.unstack: محوري استنادًا إلى قيم الفهرس بدلاً من عمود

للحصول على تحكم أفضل ، راجع وثائق الفهرسة الهرمية جنبًا إلى جنب مع طرق المكدس / فك التجميع ذات الصلة

قم بإنشاء جدول محوري بنمط جدول البيانات كإطار بيانات. سيتم تخزين المستويات في الجدول المحوري في كائنات MultiIndex (فهارس هرمية) على فهرس وأعمدة DataFrame الناتجة

القيم: العمود المراد تجميعه أو الفهرس الاختياري: العمود أو الهامور أو المصفوفة أو قائمة السابقة

DataFrame.pivot: محور بدون تجميع يمكنه التعامل مع مخطط البيانات غير الرقمية ( * أرغس, ** kwargs ) ¶

يكتب إطار البيانات المكانية على الخريطة

العدد الإجمالي للنقاط للميزة.

النقطة_من_المثلث_و_المسافة ( زاوية, مسافه: بعد, طريقة = 'GEODESCIC' ) ¶

تُرجع نقطة بزاوية ومسافة معينة بالدرجات والأمتار باستخدام نوع القياس المحدد.

  • الزاوية بالدرجات إلى النقطة التي تم إرجاعها.
  • المسافة بالأمتار حتى النقطة التي تم إرجاعها.
  • تعكس قياسات PLANAR الإسقاط الجغرافي

البيانات الموجودة على السطح ثنائي الأبعاد (بمعنى آخر ، لن تأخذ في الاعتبار انحناء الأرض). يمكن اختيار أنواع القياس GEODESIC و GREAT_ELLIPTIC و LOXODROME و PRESERVE_SHAPE كبديل ، إذا رغبت في ذلك.

إرجاع العنصر وإسقاطه من الإطار. رفع KeyError إذا لم يتم العثور عليها.

العنصر: str تسمية العمود المراد ظهورها

إرجاع نقطة على خط على مسافة محددة من بداية السطر.

للقياس أو نسبة طول الخط. إذا كانت True ، يتم استخدام القيمة كنسبة مئوية إذا كانت False ، يتم استخدام القيمة كمسافة. بالنسبة للنسب المئوية ، يجب التعبير عن القيمة كمضاعفة من 0.0 (0٪) إلى 1.0 (100٪).

القوة الأسية لإطار البيانات وغيره من العناصر (عامل التشغيل الثنائي).

مكافئ لـ dataframe ** other ، ولكن مع دعم لاستبدال fill_value عن البيانات المفقودة في أحد المدخلات.

أخرى: متسلسلة أو DataFrame أو محور ثابت:

سيتم توحيد المؤشرات غير المتطابقة معًا

همز ( المحور = لا شيء, skipna = لا شيء, المستوى = لا شيء, numeric_only = لا شيء, ** kwargs ) ¶

قم بإرجاع ناتج قيم المحور المطلوب

المحور: skipna: منطقي ، افتراضي صحيح

prod: سلسلة أو DataFrame (إذا تم تحديد المستوى)

منتج ( المحور = لا شيء, skipna = لا شيء, المستوى = لا شيء, numeric_only = لا شيء, ** kwargs ) ¶

قم بإرجاع ناتج قيم المحور المطلوب

المحور: skipna: منطقي ، افتراضي صحيح

prod: سلسلة أو DataFrame (إذا تم تحديد المستوى)

مشروع_اس ( المرجع_ المكاني, convert_name = لا شيء ) ¶

مشاريع هندسية وتطبق اختياريًا تحويلًا جغرافيًا.

كائن SpatialReference أو اسم نظام الإحداثيات.

قم بإرجاع القيم عند القيمة المحددة على المحور المطلوب ، وهو la numpy.percentile.

q: عائم أو مصفوفة ، افتراضي 0.5 (50٪ مقدر) 0 & lt = q & lt = 1 ، الكمية (المقادير) لحساب المحور: <0 ، 1 ، 'index' ، 'الأعمدة'> (افتراضي 0) 0 أو "الفهرس" للصف الحكيم ، أو 1 أو "الأعمدة" لاستيفاء الأعمدة:

تحدد هذه المعلمة الاختيارية طريقة الاستيفاء المراد استخدامها ، عندما تقع القيمة المرغوبة بين نقطتي بيانات i و j:

  • خطي: i + (j - i) * كسر ، حيث الكسر هو الجزء الكسري من الفهرس المحاط بـ i و j.
  • أقل: i.
  • أعلى: j.
  • الأقرب: i أو j أيهما أقرب.
  • نقطة المنتصف: (i + j) / 2.

الكميات: سلسلة أو DataFrame

  • إذا كانت q مصفوفة ، فسيتم إرجاع DataFrame حيث يكون الفهرس q ، والأعمدة هي أعمدة الذات ، والقيم هي القيم.
  • إذا كانت q عائمة ، فسيتم إرجاع سلسلة حيث يكون الفهرس هو أعمدة الذات والقيم هي الكميات.

استعلم عن أعمدة إطار بتعبير منطقي.

expr: string سلسلة الاستعلام المطلوب تقييمها. يمكنك الرجوع إلى المتغيرات في البيئة عن طريق جعلها مسبوقة بالحرف "& # 64" مثل & # 64a + ب. inplace: منطقي

ما إذا كان يجب على الاستعلام تعديل البيانات في مكانها أو إرجاع نسخة معدلة

يتم تمرير نتيجة تقييم هذا التعبير أولاً إلى DataFrame.loc وإذا فشل ذلك بسبب مفتاح متعدد الأبعاد (مثل DataFrame) ، فسيتم تمرير النتيجة إلى DataFrame .__ getitem __ ().

تستخدم هذه الطريقة دالة pandas.eval () ذات المستوى الأعلى لتقييم الاستعلام الذي تم تمريره.

تستخدم طريقة الاستعلام () صيغة Python معدلة بشكل طفيف افتراضيًا. على سبيل المثال ، & amp و | (على مستوى البت) المشغلين لهم الأسبقية لأبناء عمومتهم المنطقية ، و أو. هذا هو لغة Python صالحة نحويًا ، لكن الدلالات مختلفة.

يمكنك تغيير دلالات التعبير عن طريق تمرير الكلمة المفتاحية المحلل اللغوي = 'python'. هذا يفرض نفس دلالات التقييم في فضاء بايثون. وبالمثل ، يمكنك تمرير engine = 'python' لتقييم تعبير باستخدام Python نفسها كخلفية. لا ينصح بهذا لأنه غير فعال مقارنة باستخدام numexpr كمحرك.

يتم وضع سمات DataFrame.index و DataFrame.columns لمثيل DataFrame في مساحة اسم الاستعلام افتراضيًا ، مما يسمح لك بمعاملة كل من فهرس وأعمدة الإطار كعمود في الإطار. يتم استخدام فهرس المعرف لفهرس الإطارات ، ويمكنك أيضًا استخدام اسم الفهرس لتعريفه في الاستعلام.

لمزيد من التفاصيل والأمثلة ، راجع وثائق الاستعلام في الفهرسة.

يكتشف النقطة على خط متعدد الأقرب إلى in_point والمسافة بين تلك النقاط. يعرض أيضًا معلومات حول جانب الخط الذي توجد عليه النقطة الداخلية بالإضافة إلى المسافة على طول الخط حيث تحدث أقرب نقطة.

المسافة ، صحيح ، القياس سيكون نسبة مئوية

إضافة إطار البيانات والعناصر الأخرى (عامل ثنائي radd).

مكافئ لإطار بيانات + آخر ، ولكن مع دعم لاستبدال قيمة fill_value للبيانات المفقودة في أحد المدخلات.

أخرى: متسلسلة أو DataFrame أو محور ثابت:

سيتم توحيد المؤشرات غير المتطابقة معًا

رتبة ( المحور = 0, الطريقة = "المتوسط", numeric_only = لا شيء, na_option = 'الاحتفاظ', تصاعدي = صحيح, pct = خطأ ) ¶

حساب ترتيب البيانات الرقمية (من 1 إلى n) على طول المحور. يتم تعيين تصنيف للقيم المتساوية يمثل متوسط ​​رتب تلك القيم

  • المتوسط: متوسط ​​رتبة المجموعة
  • min: أدنى مرتبة في المجموعة
  • max: أعلى مرتبة في المجموعة
  • أولاً: الرتب المعينة بالترتيب الذي تظهر به في المصفوفة
  • كثيفة: مثل "min" ، لكن الترتيب يزيد دائمًا بمقدار 1 بين المجموعات
  • احتفظ: اترك قيم زمالة المدمنين المجهولين حيث هي
  • أعلى: أصغر رتبة إذا كانت صاعدة
  • أسفل: أصغر رتبة إذا تنازلي

الرتب: نفس نوع المتصل

التقسيم العائم لإطار البيانات وغيره من العناصر (عامل التشغيل الثنائي rtruediv).

مكافئ لـ / dataframe آخر ، ولكن مع دعم لاستبدال fill_value عن البيانات المفقودة في أحد المدخلات.

أخرى: متسلسلة أو DataFrame أو محور ثابت:

سيتم توحيد المؤشرات غير المتطابقة معًا

reindex ( تسميات = لا شيء, الفهرس = لا شيء, أعمدة = لا شيء, المحور = لا شيء, الطريقة = لا شيء, نسخ = صحيح, المستوى = لا شيء, fill_value = نان, الحد = لا شيء, التسامح = لا شيء ) ¶

توافق DataFrame مع فهرس جديد مع منطق ملء اختياري ، ووضع NA / NaN في المواقع التي ليس لها قيمة في الفهرس السابق. يتم إنتاج كائن جديد ما لم يكن الفهرس الجديد مكافئًا للفهرس الحالي و copy = False

تسميات: مثل المصفوفة ، تسميات / فهرس اختياري جديد لتتوافق مع المحور المحدد بواسطة "المحور" لـ. فهرس ، أعمدة: مصفوفة ، اختيارية (يجب تحديدها باستخدام كلمات رئيسية) تسميات / فهرس جديد للتوافق مع. يفضل أن يكون عنصر الفهرس لتجنب تكرار محور البيانات: int أو str ، محور اختياري للهدف. يمكن أن يكون إما اسم المحور ("الفهرس" ، "الأعمدة") أو الرقم (0 ، 1). طريقة : ، اختياري

طريقة للاستخدام لملء الثقوب في DataFrame المعاد فهرستها. يرجى ملاحظة ما يلي: هذا ينطبق فقط على DataFrames / Series ذات فهرس متزايد / متناقص بشكل رتيب.

  • الافتراضي: لا تملأ الفجوات
  • pad / ffill: نشر آخر ملاحظة صالحة للأمام إلى التالي ساري المفعول
  • ردم / ردم: استخدم الملاحظة الصحيحة التالية لملء الفراغ
  • أقرب: استخدم أقرب الملاحظات الصالحة لملء الفراغ

أقصى مسافة بين التسميات الأصلية والجديدة للمطابقات غير الدقيقة. تتوافق قيم الفهرس في المواقع المطابقة مع المعادلة abs (الفهرس [المفهرس] - الهدف) & lt = التسامح.

قد تكون التسامح قيمة عددية ، والتي تطبق نفس التفاوت على جميع القيم ، أو تشبه القائمة ، والتي تطبق تفاوتًا متغيرًا لكل عنصر. يتضمن List-like list ، و tuple ، و array ، و Series ، ويجب أن يكون بنفس حجم الفهرس ونوع dtype يجب أن يتطابق تمامًا مع نوع الفهرس.

الجديد في الإصدار 0.21.0: (تسامح يشبه القائمة)

يدعم DataFrame.reindex اصطلاحات استدعاء اثنين

نحن للغاية نوصي باستخدام وسيطات الكلمات الرئيسية لتوضيح نيتك.

قم بإنشاء إطار بيانات مع بعض البيانات الخيالية.

أنشئ فهرسًا جديدًا وأعد فهرسة إطار البيانات. يتم تعيين NaN للقيم الافتراضية في الفهرس الجديد التي لا تحتوي على سجلات مقابلة في إطار البيانات.

يمكننا ملء القيم المفقودة عن طريق تمرير قيمة إلى الكلمة الرئيسية fill_value. نظرًا لأن الفهرس لا يتزايد أو يتناقص بشكل رتيب ، فلا يمكننا استخدام وسيطات لطريقة الكلمات الرئيسية لملء قيم NaN.

يمكننا أيضًا إعادة فهرسة الأعمدة.

أو يمكننا استخدام وسيطات الكلمات الرئيسية "على غرار المحور"

لتوضيح وظيفة الملء بشكل أكبر في إعادة الفهرسة ، سننشئ إطار بيانات به فهرس متزايد بشكل رتيب (على سبيل المثال ، تسلسل التواريخ).

لنفترض أننا قررنا توسيع إطار البيانات ليشمل نطاقًا زمنيًا أوسع.

يتم افتراضيًا ملء مدخلات الفهرس التي لا تحتوي على قيمة في إطار البيانات الأصلي (على سبيل المثال ، "2009-12-29") بـ NaN. إذا رغبت في ذلك ، يمكننا ملء القيم المفقودة باستخدام أحد الخيارات المتعددة.

على سبيل المثال ، لإعادة نشر آخر قيمة صالحة لملء قيم NaN ، قم بتمرير bfill كوسيطة إلى الكلمة الأساسية للطريقة.

يرجى ملاحظة أن قيمة NaN الموجودة في إطار البيانات الأصلي (بقيمة المؤشر 2010-01-03) لن يتم ملؤها بأي من مخططات انتشار القيمة. وذلك لأن التعبئة أثناء إعادة الفهرسة لا تنظر إلى قيم إطار البيانات ، ولكنها تقارن فقط الفهارس الأصلية والمطلوبة. إذا كنت تريد ملء قيم NaN الموجودة في إطار البيانات الأصلي ، فاستخدم طريقة fillna ().

انظر دليل المستخدم للمزيد.

reindex_axis ( ملصقات, المحور = 0, الطريقة = لا شيء, المستوى = لا شيء, نسخ = صحيح, الحد = لا شيء, fill_value = نان ) ¶

تطابق كائن الإدخال مع فهرس جديد باستخدام منطق ملء اختياري ، ووضع NA / NaN في المواقع التي ليس لها قيمة في الفهرس السابق. يتم إنتاج كائن جديد ما لم يكن الفهرس الجديد مكافئًا للفهرس الحالي و copy = False

labels: تسميات جديدة تشبه المصفوفة / فهرس للتوافق مع. يفضل أن يكون عنصر الفهرس لتجنب تكرار البيانات

  • الافتراضي: لا تملأ الفجوات
  • pad / ffill: نشر آخر ملاحظة صالحة للأمام إلى التالي ساري المفعول
  • ردم / ردم: استخدم الملاحظة الصحيحة التالية لملء الفراغ
  • أقرب: استخدم أقرب الملاحظات الصالحة لملء الفراغ

أقصى مسافة بين التسميات الأصلية والجديدة للمطابقات غير الدقيقة. تفي قيم الفهرس في المواقع المطابقة بمعادلة القيمة المطلقة (الفهرس [المفهرس] - الهدف) & lt = التسامح.

قد تكون التسامح قيمة عددية ، والتي تطبق نفس التفاوت على جميع القيم ، أو تشبه القائمة ، والتي تطبق تفاوتًا متغيرًا لكل عنصر. يتضمن List-like list ، و tuple ، و array ، و Series ، ويجب أن يكون بنفس حجم الفهرس ونوع dtype يجب أن يتطابق تمامًا مع نوع الفهرس.

الجديد في الإصدار 0.21.0: (تسامح يشبه القائمة)

إعادة الفهرسة ( آخر, الطريقة = لا شيء, نسخ = صحيح, الحد = لا شيء, التسامح = لا شيء ) ¶

أعد كائنًا بمؤشرات مطابقة لنفسي.

آخر: أسلوب الكائن: سلسلة أو لا نسخة: منطقية ، الافتراضي صحيح الحد: int ، الافتراضي بلا

أقصى مسافة بين تسميات الكائن الآخر وهذا الكائن للمطابقات غير الدقيقة. يمكن أن تكون على شكل قائمة.

الجديد في الإصدار 0.21.0: (تسامح يشبه القائمة)

إعادة تسمية ( مخطط = لا شيء, الفهرس = لا شيء, أعمدة = لا شيء, المحور = لا شيء, نسخ = صحيح, inplace = خطأ, المستوى = لا شيء ) ¶

يجب أن تكون قيم دالة / ديكت فريدة (1 إلى 1). الملصقات غير الموجودة في مجموعة / ديكت سيتم تركها كما هي. التصنيفات الإضافية المدرجة لا تسبب خطأ.

انظر دليل المستخدم للمزيد.

مخطط ، فهرس ، أعمدة: ديكت شبيهة أو دالة ، تحويلات شبيهة أو وظائف اختيارية لتطبيقها على قيم هذا المحور. استخدم إما مخطط الخرائط والمحور لتحديد المحور المراد استهدافه باستخدام مصمم الخرائط أو الفهرس والأعمدة. المحور: int أو str ، محور اختياري لاستهدافه باستخدام مخطط. يمكن أن يكون إما اسم المحور ("الفهرس" ، "الأعمدة") أو الرقم (0 ، 1). الافتراضي هو "الفهرس". نسخ: منطقي ، افتراضي صحيح ، انسخ أيضًا البيانات الأساسية في المكان: منطقي ، افتراضي خطأ ما إذا كان سيتم إرجاع٪ (klass) s جديد. إذا كان صحيحًا ، فسيتم تجاهل قيمة النسخة. المستوى: int أو level name ، افتراضي None في حالة وجود MultiIndex ، قم فقط بإعادة تسمية الملصقات في المستوى المحدد.

يدعم DataFrame.rename اصطلاحات استدعاء اثنين

نحن للغاية نوصي باستخدام وسيطات الكلمات الرئيسية لتوضيح نيتك.

استخدام معلمات نمط المحور

قم بتعديل اسم الفهرس أو الأعمدة.

معين: قيمة قياسية ، تشبه القائمة ، اختيارية لتعيين سمة اسم المحور.

المحور: int أو string ، الافتراضي 0 copy: منطقي ، افتراضي صحيح

inplace: منطقي ، افتراضي خطأ

تمت إعادة تسميته: نوع المتصل أو لا شيء إذا كان inplace = True

قبل الإصدار 0.21.0 ، يمكن أيضًا استخدام rename_axis لتغيير المحور ملصقات عن طريق تمرير التعيين أو العدد. تم إهمال هذا السلوك وستتم إزالته في إصدار مستقبلي. استخدم إعادة التسمية بدلاً من ذلك.

pandas.Series.rename، pandas.DataFrame.ename pandas.index.rename

إعادة ترتيب مستويات الفهرس باستخدام ترتيب الإدخال. لا يجوز إسقاط أو تكرار المستويات

ترتيب: قائمة int أو قائمة str قائمة تمثل ترتيب مستوى جديد. المستوى المرجعي بالرقم (الموضع) أو بالمفتاح (التسمية). المحور: int حيث يتم إعادة ترتيب المستويات.

نوع المتصل (كائن جديد)

يستبدل ( to_replace = لا شيء, القيمة = لا شيء, inplace = خطأ, الحد = لا شيء, regex = خطأ, الطريقة = 'وسادة', المحور = لا شيء ) ¶

استبدل القيم الواردة في "to_replace" بـ "value".

to_replace: str ، أو regex ، أو قائمة ، أو ديكت ، أو سلسلة ، أو رقمية ، أو لا شيء

  • str: السلسلة المطابقة تمامًا to_replace سيتم استبدالها بالقيمة
  • regex: سيتم استبدال regexs المطابقة to_replace بالقيمة

قائمة str أو regex أو رقمية:

  • أولاً ، إذا كان to_replace و value عبارة عن قائمتين ، فإنهما يجب تكون بنفس الطول.
  • ثانيًا ، إذا كان التعبير العادي = صحيحًا ، فإن كل السلاسل بتنسيق على حد سواء سيتم تفسير القوائم على أنها regexs وإلا فستتطابق مباشرةً. لا يهم هذا كثيرًا بالنسبة للقيمة نظرًا لوجود عدد قليل فقط من الرموز التعبيرية البديلة الممكنة التي يمكنك استخدامها.
  • تطبق قواعد str و regex على النحو الوارد أعلاه.
  • تُقرأ القواميس المتداخلة ، على سبيل المثال ، <"a": <"b": nan >> ، على النحو التالي: ابحث في العمود "a" عن القيمة "b" واستبدلها بـ nan. يمكنك أيضًا تداخل التعبيرات العادية. لاحظ أن أسماء الأعمدة (مفاتيح القاموس ذات المستوى الأعلى في قاموس متداخل) لا تستطيع تكون تعابير عادية.
  • يتم تعيين المفاتيح لأسماء الأعمدة ويتم تعيين القيم لقيم الاستبدال. يمكنك التعامل مع هذا كحالة خاصة لتمرير قائمتين باستثناء أنك تحدد العمود للبحث فيه.
  • هذا يعني أن وسيطة regex يجب أن تكون سلسلة ، أو تعبيرًا عاديًا مجمعًا ، أو قائمة ، أو ديكت ، أو ndarray ، أو سلسلة من هذه العناصر. إذا كانت القيمة أيضًا لا شيء ، فهذا يعني أيضًا يجب أن يكون قاموسًا متداخلًا أو متسلسلاً.

راجع قسم الأمثلة للحصول على أمثلة لكل منها.

NDFrame.reindex NDFrame.asfreq NDFrame.fillna

  • إذا لم يكن regex منطقيًا ولم يكن to_replace لا شيء.
  • إذا كان to_replace عبارة عن إملاء والقيمة ليست قائمة ، أو dict ، أو ndarray ، أو سلسلة
  • إذا كان to_replace عبارة عن بلا و regex غير قابل للترجمة إلى تعبير عادي أو عبارة عن قائمة ، أو dict ، أو ndarray ، أو سلسلة.
  • إذا كان to_replace والقيمة عبارة عن قائمة s أو ndarray ، لكنهما ليسا بنفس الطول.
  • يتم إجراء استبدال Regex تحت الغطاء باستخدام re.sub. قواعد الاستبدال لـ re.sub هي نفسها.
  • سيتم استبدال التعبيرات العادية بالسلاسل فقط ، مما يعني أنه لا يمكنك توفير ، على سبيل المثال ، تعبير عادي يطابق أرقام الفاصلة العائمة ويتوقع مطابقة الأعمدة الموجودة في إطارك التي تحتوي على نوع رقمي. ومع ذلك ، إذا كانت تلك الأرقام الفاصلة العائمة نكون السلاسل ، ثم يمكنك القيام بذلك.
  • هذه الطريقة لها كثيرا من الخيارات. نشجعك على تجربة هذه الطريقة واللعب بها لاكتساب الحدس حول كيفية عملها.

إعادة طرح إطار بيانات معين في نظام إحداثيات جديد.

طريقة ملائمة لتحويل التردد وإعادة تشكيل السلاسل الزمنية. يجب أن يحتوي الكائن على فهرس يشبه التاريخ والوقت (DatetimeIndex أو PeriodIndex أو TimedeltaIndex) ، أو تمرير قيم تشبه التاريخ والوقت إلى الكلمة الأساسية on أو level.

القاعدة: سلسلة سلسلة الإزاحة أو الكائن الذي يمثل التحويل الهدف

المحور: int ، اختياري ، الافتراضي 0 مغلق:

بالنسبة إلى DataFrame ، يجب استخدام العمود بدلاً من الفهرس لإعادة التشكيل. يجب أن يكون العمود مثل التاريخ والوقت.

بالنسبة إلى MultiIndex ، المستوى (الاسم أو الرقم) لاستخدامه في إعادة التشكيل. يجب أن يكون المستوى مثل التاريخ والوقت.

لمعرفة المزيد حول سلاسل الإزاحة ، يرجى الاطلاع على هذا الارتباط.

ابدأ بإنشاء سلسلة من 9 طوابع زمنية دقيقة واحدة.

اختزل السلسلة إلى صناديق مدتها 3 دقائق وجمع قيم الطوابع الزمنية التي تقع في سلة المهملات.

اختزل السلسلة إلى صناديق مدتها 3 دقائق كما هو مذكور أعلاه ، لكن قم بتسمية كل حاوية باستخدام الحافة اليمنى بدلاً من اليسار. يرجى ملاحظة أن القيمة الموجودة في الحاوية المستخدمة كملصق غير مدرجة في الحاوية ، والتي يتم تسميتها. على سبيل المثال ، في المجموعة الأصلية ، تحتوي المجموعة 2000-01-01 00:03:00 على القيمة 3 ، لكن القيمة المجمعة في المجموعة المعاد تشكيلها بالتسمية 2000-01-01 00:03:00 لا تتضمن 3 ( إذا حدث ذلك ، فستكون القيمة المجمعة 6 ، وليس 3). لتضمين هذه القيمة ، أغلق الجانب الأيمن من فاصل الحاوية كما هو موضح في المثال أدناه.

اختزل السلسلة إلى صناديق مدتها 3 دقائق كما هو مذكور أعلاه ، لكن أغلق الجانب الأيمن من فاصل الحاوية.

قم بتجميع السلسلة في حاويات 30 ثانية.

قم بتجميع السلسلة في حاويات 30 ثانية واملأ قيم NaN باستخدام طريقة الوسادة.

قم بتجميع السلسلة في صناديق 30 ثانية واملأ قيم NaN باستخدام طريقة bfill.

قم بتمرير وظيفة مخصصة عبر التطبيق

بالنسبة إلى سلسلة تحتوي على مؤشر الفترة ، يمكن استخدام اصطلاح الكلمات الأساسية للتحكم في استخدام بداية القاعدة أو نهايتها.

أعد أخذ العينات حسب الشهر باستخدام اصطلاح "البدء". يتم تعيين القيم للشهر الأول من الفترة.

أعد أخذ العينات حسب الشهر باستخدام اصطلاح "النهاية". يتم تعيين القيم للشهر الأخير من الفترة.

بالنسبة لكائنات DataFrame ، يمكن استخدام الكلمة الأساسية في لتحديد العمود بدلاً من الفهرس لإعادة التشكيل.

بالنسبة إلى DataFrame مع MultiIndex ، يمكن استخدام مستوى الكلمة الأساسية لتحديد المستوى الذي تحتاجه إعادة التشكيل.

بالنسبة إلى DataFrame مع فهرس متعدد المستويات ، قم بإرجاع DataFrame الجديد مع معلومات التسمية في الأعمدة الموجودة أسفل أسماء الفهرس ، وافتراضيًا إلى "level_0" و "level_1" وما إلى ذلك ، إذا لم يكن هناك أي شيء. بالنسبة إلى فهرس قياسي ، سيتم استخدام اسم الفهرس (إذا تم تعيينه) ، وإلا فسيتم استخدام "فهرس" افتراضي أو "مستوى_0" (إذا تم استخدام "فهرس" بالفعل).

المستوى: int، str، tuple، or list، default لاشيء فقط قم بإزالة المستويات المحددة من الفهرس. يزيل جميع المستويات بشكل افتراضي: منطقي ، افتراضي خطأ لا تحاول إدراج فهرس في أعمدة إطار البيانات. يؤدي هذا إلى إعادة تعيين الفهرس إلى فهرس الأعداد الصحيحة الافتراضي. inplace: منطقي ، افتراضي False قم بتعديل DataFrame في مكانه (لا تقم بإنشاء كائن جديد) col_level: int أو str ، افتراضي 0 إذا كانت الأعمدة تحتوي على مستويات متعددة ، تحدد المستوى الذي سيتم إدراج التسميات فيه. بشكل افتراضي يتم إدراجه في المستوى الأول. col_fill: object ، افتراضي "" إذا كانت الأعمدة تحتوي على مستويات متعددة ، فإنها تحدد كيفية تسمية المستويات الأخرى. إذا لم يتم تكرار اسم الفهرس.

عندما نعيد ضبط الفهرس ، يُضاف الفهرس القديم كعمود ، ويستخدم فهرس تسلسلي جديد:

يمكننا استخدام معامل الإسقاط لتجنب إضافة الفهرس القديم كعمود:

يمكنك أيضًا استخدام reset_index مع MultiIndex.

إذا كان للفهرس مستويات متعددة ، فيمكننا إعادة تعيين مجموعة فرعية منها:

إذا لم نقم بإسقاط الفهرس ، فسيتم وضعه في المستوى الأعلى افتراضيًا. يمكننا وضعه في مستوى آخر:

عندما يتم إدراج الفهرس تحت مستوى آخر ، يمكننا تحديد أي واحد تحته باستخدام المعلمة col_fill:

إذا حددنا مستوى غير موجود لـ col_fill ، يتم إنشاؤه:

تقسيم صحيح لإطار البيانات وغيره ، من ناحية العناصر (عامل ثنائي rfloordiv).

مكافئ لـ // dataframe أخرى ، ولكن مع دعم لاستبدال fill_value للبيانات المفقودة في أحد المدخلات.

أخرى: متسلسلة أو DataFrame أو محور ثابت:

سيتم توحيد المؤشرات غير المتطابقة معًا

Modulo of dataframe and other، element-wise (مشغل ثنائي rmod).

مكافئ لـ٪ dataframe الأخرى ، ولكن مع دعم لاستبدال fill_value للبيانات المفقودة في أحد المدخلات.

أخرى: متسلسلة أو DataFrame أو محور ثابت:

سيتم توحيد المؤشرات غير المتطابقة معًا

مضاعفة إطار البيانات وغيرها ، من ناحية العناصر (عامل ثنائي rmul).

مكافئ لإطار بيانات * آخر ، ولكن مع دعم لاستبدال fill_value للبيانات المفقودة في أحد المدخلات.

أخرى: متسلسلة أو DataFrame أو محور ثابت:

سيتم توحيد المؤشرات غير المتطابقة معًا

المتداول ( نافذة او شباك, min_periods = لا شيء, التكرار = لا شيء, المركز = خطأ, win_type = لا شيء, تشغيل = لا شيء, المحور = 0, مغلق = لا شيء ) ¶

يوفر حسابات نافذة المتداول.

حجم النافذة المتحركة. هذا هو عدد المشاهدات المستخدمة لحساب الإحصاء. ستكون كل نافذة بحجم ثابت.

إذا كانت هناك إزاحة ، فستكون هذه هي الفترة الزمنية لكل نافذة. ستكون كل نافذة بحجم متغير بناءً على الملاحظات المدرجة في الفترة الزمنية. هذا صالح فقط لفهارس تشبه البيانات. هذا جديد في 0.19.0

min_periods: int ، default لا شيء الحد الأدنى لعدد المشاهدات في النافذة المطلوبة للحصول على قيمة (وإلا تكون النتيجة NA). بالنسبة للنافذة التي تم تحديدها بواسطة الإزاحة ، سيكون هذا افتراضيًا على 1. freq: string أو DateOffset object ، اختياري (افتراضي لا شيء)

موقوف منذ الإصدار 0.18.0: التردد لمطابقة البيانات قبل حساب الإحصاء. محدد كسلسلة تردد أو كائن DateOffset.

اجعل الفاصل الزمني مغلقًا على نقاط النهاية "اليمنى" أو "اليسرى" أو "كلاهما" أو "لا". بالنسبة للنوافذ المستندة إلى الأوفست ، يتم تعيينها افتراضيًا على "right". بالنسبة إلى النوافذ الثابتة ، يتم تعيين الإعدادات الافتراضية على "كلاهما". الحالات المتبقية التي لم تنفذ للنوافذ الثابتة.

المحور: int أو string ، الافتراضي 0

نافذة أو متداول مصنفة فرعية لعملية معينة

عرض المبلغ بطول نافذة 2 ، باستخدام نوع النافذة "المثلث".

المتداول مجموع بطول نافذة 2 ، min_periods الافتراضي لطول النافذة.

كما هو مذكور أعلاه ، ولكن الوضوح حدد min_periods

خشن (بمعنى غير منتظم) ، DataFrame مفهرس بالوقت

على النقيض من نافذة التدوير ذات العدد الصحيح ، سيؤدي ذلك إلى ظهور نافذة متغيرة الطول تتوافق مع الفترة الزمنية. الافتراضي ل min_periods هو 1.

بشكل افتراضي ، يتم تعيين النتيجة على الحافة اليمنى من النافذة. يمكن تغيير هذا إلى وسط النافذة عن طريق تحديد المركز = صحيح.

تُستخدم الكلمة الأساسية التكرار لمطابقة بيانات السلاسل الزمنية للتردد المحدد عن طريق إعادة تشكيل البيانات. يتم ذلك باستخدام المعلمات الافتراضية لـ resample () (أي باستخدام المتوسط).

لمعرفة المزيد حول الإزاحات وسلاسل تردد أمبير ، يرجى الاطلاع على هذا الارتباط.

أنواع win_type المعترف بها هي:

  • عربة
  • مثلث
  • رجل اسود
  • يدق
  • بارتليت
  • بارزين
  • بوهمان
  • بلاكمانهاريس
  • nuttall
  • بارتان
  • كايزر (يحتاج بيتا)
  • gaussian (يحتاج الأمراض المنقولة جنسياً)
  • general_gaussian (يحتاج القوة والعرض)
  • Slepian (يحتاج العرض).

تقريب DataFrame إلى عدد متغير من المنازل العشرية.

القوة الأسية لإطار البيانات وغيره من العناصر (عامل التشغيل الثنائي rpow).

مكافئ لإطار بيانات ** آخر ، ولكن مع دعم لاستبدال قيمة fill_value للبيانات المفقودة في أحد المدخلات.

أخرى: متسلسلة أو DataFrame أو محور ثابت:

سيتم توحيد المؤشرات غير المتطابقة معًا

طرح إطار البيانات وغيره من العناصر (عامل التشغيل الثنائي rsub).

مكافئ لـ other - dataframe ، ولكن مع دعم لاستبدال fill_value عن البيانات المفقودة في أحد المدخلات.

أخرى: متسلسلة أو DataFrame أو محور ثابت:

سيتم توحيد المؤشرات غير المتطابقة معًا

rtruediv ( آخر, المحور = "أعمدة", المستوى = لا شيء, fill_value = لا شيء ) ¶

التقسيم العائم لإطار البيانات وغيره من العناصر (عامل التشغيل الثنائي rtruediv).

مكافئ لـ / dataframe آخر ، ولكن مع دعم لاستبدال fill_value عن البيانات المفقودة في أحد المدخلات.

أخرى: متسلسلة أو DataFrame أو محور ثابت:

سيتم توحيد المؤشرات غير المتطابقة معًا

عينة ( ن = لا شيء, frac = لا شيء, استبدال = خطأ, الأوزان = لا شيء, random_state = لا شيء, المحور = لا شيء ) ¶

تُرجع عينة عشوائية من العناصر من محور كائن.

n: int ، عدد العناصر الاختيارية من المحور المراد إرجاعها. لا يمكن استخدامها مع فارك. الافتراضي = 1 إذا كان frac = لا شيء. frac: عائم ، كسر اختياري لعناصر المحور لإرجاعه. لا يمكن استخدامها مع n. استبدال: منطقية ، عينة اختيارية مع أو بدون استبدال. الافتراضي = خطأ. أوزان: str أو ndarray-like ، اختياري "لا شيء" ينتج عنه ترجيح احتمالية متساوية. إذا تم تمرير سلسلة ، فسيتم محاذاة الكائن الهدف في الفهرس. سيتم تجاهل قيم الفهرس في الأوزان التي لم يتم العثور عليها في كائن تم اختبار عيّناته ، وسيتم تعيين قيم الفهرس في كائن تم اختبار عيناته وليس في أوزان بأوزان بقيمة صفر. إذا تم استدعاؤها على DataFrame ، فسيقبل اسم العمود عندما يكون المحور = 0. ما لم تكن الأوزان سلسلة ، يجب أن تكون الأوزان بنفس طول المحور الذي يتم أخذ عينات منه. إذا لم يتم جمع الأوزان إلى 1 ، فسيتم تسويتها لمجموعها إلى 1. سيتم التعامل مع القيم المفقودة في عمود الأوزان على أنها صفر. قيم inf و -inf غير مسموح بها. random_state: int أو numpy.random.RandomState ، بذرة اختيارية لمولد الأرقام العشوائية (إذا كان صحيحًا) ، أو كائن RandomState numpy. المحور: عدد صحيح أو سلسلة ، محور اختياري للعينة. يقبل رقم المحور أو الاسم. الافتراضي هو المحور الأساسي لنوع البيانات المحدد (0 للسلسلة وأطر البيانات ، 1 للوحات).

كائن جديد من نفس نوع المتصل.

قم بإنشاء مثال على المتسلسلة وإطار البيانات:

بعد ذلك ، استخرج عينة عشوائية من كلا هذين الكائنين ...

3 عناصر عشوائية من السلسلة:

وعشوائية 10٪ من DataFrame مع الاستبدال:

إرجاع شكل متعدد الخطوط بين قياسات البداية والنهاية. مشابه لـ Polyline.positionAlongLine ولكنه سيعيد مقطع متعدد الخطوط بين نقطتين على الخط المتعدد بدلاً من نقطة واحدة.

وحدات ثابتة أو كنسبة. إذا كان True ، يتم استخدام start_measure و end_measure كنسبة مئوية إذا تم استخدام False ، يتم استخدام start_measure و end_measure كمسافة. بالنسبة للنسب المئوية ، يجب التعبير عن المقاييس على أنها مضاعفة من 0.0 (0 بالمائة) إلى 1.0 (100 بالمائة).

قم بإرجاع البيانات المقابلة لمعايير مطابقة تسميات المحور

مهمل: استخدم df.loc [df.index.map (crit)] للاختيار من خلال التصنيفات

crit: وظيفة يتم استدعاؤها على كل فهرس (تسمية). يجب أن تعود بصواب أو خطأ

التحديد: نوع المتصل

select_by_location ( آخر, Match_only = صحيح ) ¶

تحديد جميع الصفوف في SpatialDataFrame بناءً على هندسة معينة

other: arcpy.Geometry object match_only: القيمة المنطقية ، إذا كانت صحيحة ، فستكون السجلات المتطابقة فقط

قم بإرجاع مجموعة فرعية من DataFrame بما في ذلك / استبعاد الأعمدة بناءً على نوع dtype.

  • إذا كانت كل من التضمين والاستبعاد فارغة
  • إذا كان للتضمين والاستبعاد عناصر متداخلة
  • إذا تم تمرير أي نوع من أنواع السلاسل.
  • لتحديد الكل رقمي الأنواع تستخدم dtype numpy numpy.number
  • لتحديد سلاسل يجب عليك استخدام نوع الكائن ، ولكن لاحظ أن هذا سيعود الكل أعمدة نوع الكائن
  • انظر التسلسل الهرمي للنوع الرقمي
  • لتحديد datetimes ، استخدم np.datetime64 أو "datetime" أو "datetime64"
  • لتحديد timedeltas ، استخدم np.timedelta64 أو "timedelta" أو "timedelta64"
  • لتحديد أنواع فئات Pandas ، استخدم "الفئة"
  • لتحديد أنواع بيانات Pandas ، استخدم "datetimetz" (جديد في 0.20.0) ، أو سلسلة "datetime64 [ns، tz]"

إرجاع الخطأ المعياري غير المتحيز للمتوسط ​​فوق المحور المطلوب.

تمت تسويته بواسطة N-1 افتراضيًا. يمكن تغيير هذا باستخدام وسيطة ddof

المحور: skipna: منطقي ، افتراضي صحيح

sem: سلسلة أو DataFrame (إذا تم تحديد المستوى)

قم بإرجاع مربع إحاطة واحد (xmin ، ymin ، xmax ، ymax) لجميع الأشكال الهندسية

هذا اختصار لحساب الحد الأدنى / الأقصى لحدود x و y بشكل فردي.

قم بتعيين الفهرس المطلوب لمحور معين

labels: قائمة تشبه أو فهرس قيم الفهرس الجديد

المحور: int أو سلسلة ، الافتراضي 0 inplace: منطقي ، افتراضي بلا

ما إذا كان سيتم إرجاع مثيل NDFrame جديد أم لا.

تحذير: inplace = لا شيء يعود حاليًا إلى True ، ولكن في إصدار مستقبلي ، سيتم تعيينه افتراضيًا على False. استخدم inplace = True بشكل صريح بدلاً من الاعتماد على الافتراضي.

الجديد في الإصدار 0.21.0: يتم جعل التوقيع متسقًا مع بقية واجهة برمجة التطبيقات. في السابق ، كانت وسيطتا "المحور" و "العلامات" هما على التوالي الحجج الموضعية الأولى والثانية.

قم بتعيين هندسة SpatialDataFrame باستخدام عمود موجود أو إدخال محدد. بشكل افتراضي ينتج كائن جديد.

يتم استبدال العمود الهندسي الأصلي بالإدخال.

المعلمات: العمود: تسمية العمود أو إسقاط المصفوفة: منطقي ، افتراضي صحيح

set_index ( مفاتيح, قطرة = صحيح, إلحاق = خطأ, inplace = خطأ, Verify_integrity = خطأ ) ¶

قم بتعيين فهرس DataFrame (تسميات الصفوف) باستخدام عمود أو أكثر من الأعمدة الموجودة. بشكل افتراضي ينتج كائن جديد.

المفاتيح: تسمية العمود أو قائمة تسميات الأعمدة / إسقاط المصفوفات: منطقي ، افتراضي صحيح

قم بتعيين الفهرس ليصبح عمود "الشهر":

أنشئ فهرسًا متعددًا باستخدام عمودي "السنة" و "الشهر":

أنشئ فهرسًا متعددًا باستخدام مجموعة من القيم وعمود:

ضع قيمة واحدة في العمود والفهرس الذي تم تمريره

مهملة منذ الإصدار 0.21.0.

الرجاء استخدام ملحقات .at [] أو .iat [].

الفهرس: تسمية الصف العمود: قيمة تسمية العمود: القيمة العددية التي يمكن أخذها: تفسير الفهرس / العمود كمفهرسات ، القيمة الافتراضية خطأ

الإطار: DataFrame إذا تم احتواء زوج التسمية ، فسيتم الإشارة إلى استدعاء DataFrame ، وإلا سيكون شكل كائن جديد ¶

قم بإرجاع مجموعة تمثل أبعاد DataFrame.

قم بتحويل الفهرس حسب العدد المطلوب من الفترات باستخدام التكرار الزمني الاختياري

الفترات: int عدد الفترات المراد نقلها ، يمكن أن تكون موجبة أو سالبة التكرار: DateOffset ، أو timedelta ، أو سلسلة القاعدة الزمنية ، زيادة اختيارية للاستخدام من وحدة tseries أو قاعدة الوقت (مثل "EOM") انظر إلى الملاحظات.

إذا تم تحديد التكرار ، فسيتم تبديل قيم الفهرس ولكن لا يتم إعادة ترتيب البيانات. أي ، استخدم التكرار إذا كنت ترغب في توسيع الفهرس عند تغيير البيانات الأصلية والاحتفاظ بها.

عدد العناصر في NDFrame

انحراف ( المحور = لا شيء, skipna = لا شيء, المستوى = لا شيء, numeric_only = لا شيء, ** kwargs ) ¶

إرجاع الانحراف غير المتحيز على المحور المطلوب تطبيعه بواسطة N-1

المحور: skipna: منطقي ، افتراضي صحيح

الانحراف: سلسلة أو DataFrame (إذا تم تحديد المستوى)

مكافئ للتحويل بدون نسخ البيانات. لن تتضمن البيانات التي تم تحويلها فترات الإسقاط وسيكون المحور الذي تم إزاحته أصغر من المحور الأصلي.

الفترات: int عدد الفترات للتحرك ، يمكن أن تكون موجبة أو سلبية

بينما يكون slice_shift أسرع من shift ، قد تدفع مقابله لاحقًا أثناء المحاذاة.

تحول: نفس نوع المتصل

تُرجع نقطة جديدة بناءً على in_point المحاذي لهذه الهندسة.

فرز الكائن حسب التسميات (على طول المحور)

المحور: الفهرس ، الأعمدة لمستوى الفرز المباشر: اسم المستوى أو اسم المستوى أو قائمة ints أو قائمة أسماء المستوى

Sort_values ​​( بواسطة, المحور = 0, تصاعدي = صحيح, inplace = خطأ, النوع = 'الترتيب السريع', na_position = 'آخر' ) ¶

قم بالفرز حسب القيم الموجودة على أي من المحورين

تم الإيقاف: استخدم DataFrame.sort_index ()

قم بفرز الفهرس متعدد المستويات حسب المحور المختار والمستوى الأساسي. سيتم فرز البيانات معجميًا حسب المستوى المختار متبوعًا بالمستويات الأخرى (بالترتيب)

المستوى: المحور الداخلي: <0 أو "الفهرس" ، 1 أو "الأعمدة"> ، الافتراضي 0 تصاعدي: منطقي ، افتراضي صحيح inplace: منطقي ، افتراضي خطأ

الإسناد المكاني للهندسة.

ضغط بطول 1 أبعاد.

المحور: لا شيء ، عدد صحيح أو اسم محور السلسلة ، اختياري

المحور المراد ضغطه إذا كان بحجم 1.

عددي إذا كان بحجم واحد ، كائن أصلي آخر

قم بتحوير مستوى تسميات الأعمدة (ربما تكون هرمية) ، وإرجاع DataFrame (أو سلسلة في حالة كائن بمستوى واحد من تسميات الأعمدة) التي لها فهرس هرمي بمستوى داخلي جديد من تسميات الصفوف. سيتم فرز المستوى المعني تلقائيًا.

المستوى: int ، أو سلسلة ، أو قائمة ، المستوى (المستويات) الأخير الافتراضي للتكدس ، يمكن أن يجتاز إسقاط اسم المستوى: منطقي ، افتراضي صحيح ما إذا كان سيتم إسقاط صفوف في الإطار / السلسلة الناتجة بدون قيم صالحة

مكدسة: DataFrame أو سلسلة

إرجاع نموذج الانحراف المعياري على المحور المطلوب.

تمت تسويته بواسطة N-1 افتراضيًا. يمكن تغيير هذا باستخدام وسيطة ddof

المحور: skipna: منطقي ، افتراضي صحيح

std: سلسلة أو DataFrame (إذا تم تحديد المستوى)

تقوم الخاصية بإرجاع كائن Styler الذي يحتوي على طرق لبناء تمثيل HTML نمط لإطار DataFrame.

طرح إطار البيانات وغيره من العناصر (عامل التشغيل الثنائي الفرعي).

مكافئ لـ dataframe - أخرى ، ولكن مع دعم لاستبدال fill_value عن البيانات المفقودة في أحد المدخلات.

أخرى: متسلسلة أو DataFrame أو محور ثابت:

سيتم توحيد المؤشرات غير المتطابقة معًا

طرح او خصم ( آخر, المحور = "أعمدة", المستوى = لا شيء, fill_value = لا شيء ) ¶

طرح إطار البيانات وغيره من العناصر (عامل التشغيل الثنائي الفرعي).

مكافئ لـ dataframe - أخرى ، ولكن مع دعم لاستبدال fill_value عن البيانات المفقودة في أحد المدخلات.

أخرى: متسلسلة أو DataFrame أو محور ثابت:

سيتم توحيد المؤشرات غير المتطابقة معًا

قم بإرجاع مجموع قيم المحور المطلوب

المحور: skipna: منطقي ، افتراضي صحيح

المجموع: سلسلة أو DataFrame (إذا تم تحديد المستوى)

قم بتبادل المحاور وقيم المحاور بشكل مناسب

قم بتبديل المستويين i و j في مؤشر MultiIndex على محور معين

i، j: int، string (يمكن خلطه) مستوى المؤشر المراد تبديله. يمكن تمرير اسم المستوى كسلسلة.

مبادلة: نوع المتصل (كائن جديد)

تم التغيير في الإصدار 0.18.1: أصبحت الفهارس i و j اختيارية الآن ، وافتراضية إلى المستويين الأعمق من الفهرس.

يُنشئ الشكل الهندسي الذي يمثل اتحادًا بين شكلين هندسيين مطروحًا منه تقاطع هاتين الشكلين. يجب أن تكون هندسي الإدخال من نفس نوع الشكل. المعلمات:

n: int ، افتراضي 5 عدد الصفوف المراد تحديدها. obj_tail: نوع المتصل آخر عدد من الصفوف من كائن المتصل. يأخذ ( المؤشرات, المحور = 0, تحويل = لا شيء, is_copy = صحيح, ** kwargs ) ¶

إعادة العناصر في المعطى الموضعية مؤشرات على طول المحور.

هذا يعني أننا لا نقوم بالفهرسة وفقًا للقيم الفعلية في سمة الفهرس للكائن. نحن نقوم بالفهرسة وفقًا للموضع الفعلي للعنصر في الكائن.

المؤشرات: مصفوفة شبيهة بمصفوفة من ints تشير إلى المواضع التي يجب اتخاذها. المحور: int ، الافتراضي 0 المحور الذي يجب تحديد العناصر عليه. يعني "0" أننا نختار صفوفًا ، ويعني "1" أننا نختار أعمدة ، وما إلى ذلك. تحويل: منطقي ، افتراضي صحيح

مهملة منذ الإصدار 0.21.0: في المستقبل ، سيتم تحويل المؤشرات السالبة دائمًا.

ما إذا كان سيتم تحويل المؤشرات السلبية إلى مؤشرات إيجابية. على سبيل المثال ، يمكن تعيين -1 إلى لين (المحور) - 1. التحويلات مماثلة لسلوك فهرسة قائمة Python العادية.

is_copy: منطقي ، افتراضي صحيح ما إذا كان سيتم إرجاع نسخة من الكائن الأصلي أم لا.

خذ العناصر في الموضعين 0 و 3 على طول المحور 0 (افتراضي).

لاحظ كيف أن المؤشرات الفعلية المحددة (0 و 1) لا تتوافق مع مؤشراتنا المحددة 0 و 3. وذلك لأننا نختار الصفين 0 و 3 ، وليس الصفوف التي تساوي مؤشراتها 0 و 3.

خذ العناصر في الفهرين 1 و 2 على طول المحور 1 (اختيار العمود).

قد نأخذ عناصر باستخدام الأعداد الصحيحة السالبة للمؤشرات الموجبة ، بدءًا من نهاية الكائن ، تمامًا كما هو الحال مع قوائم Python.

محاولة كتابة تمثيل نصي للكائن في حافظة النظام يمكن لصق هذا في Excel ، على سبيل المثال.

excel: منطقي ، افتراضيات إلى True if True ، استخدم الفاصل المتوفر ، اكتب في تنسيق csv للسماح بسهولة اللصق في Excel. إذا كان خطأ ، فاكتب سلسلة تمثيل للكائن إلى الحافظة

sep: اختياري ، يتم تمرير الإعدادات الافتراضية لعلامة التبويب الكلمات الرئيسية الأخرى إلى to_csv

اكتب DataFrame في ملف قيم مفصولة بفواصل (csv)

path_or_buf: سلسلة أو مقبض ملف ، افتراضي لا شيء مسار ملف أو كائن ، إذا لم يتم توفير أي شيء ، يتم إرجاع النتيجة كسلسلة. sep: حرف ، افتراضي "،" محدد الحقل لملف الإخراج. na_rep: string، الافتراضي "" تمثيل البيانات مفقود float_format: string، افتراضي لا شيء تنسيق سلسلة لأرقام الفاصلة العائمة أعمدة: تسلسل ، أعمدة اختيارية لكتابة الرأس: منطقية أو قائمة سلسلة ، افتراضي صحيح اكتب أسماء الأعمدة. إذا تم تقديم قائمة من السلاسل ، فمن المفترض أن تكون أسماء مستعارة لفهرس أسماء الأعمدة: منطقية ، أو افتراضية كتابة أسماء الصفوف الحقيقية (الفهرس) index_label: سلسلة أو تسلسل ، أو خطأ ، لا شيء افتراضي تسمية العمود لأعمدة الفهرس إذا رغبت في ذلك . إذا لم يتم تقديم أي شيء ، وكان الرأس والفهرس صحيحين ، فسيتم استخدام أسماء الفهرس. يجب إعطاء تسلسل إذا كان DataFrame يستخدم MultiIndex. إذا كان خطأ لا تطبع الحقول لأسماء الفهرس. استخدم index_label = False لتسهيل الاستيراد في وضع R: وضع كتابة str Python ، ترميز 'w' الافتراضي: سلسلة ، سلسلة اختيارية تمثل الترميز المراد استخدامه في ملف الإخراج ، يتم تعيينها افتراضيًا على 'ascii' في Python 2 و 'utf-8 'في Python 3. compression: string ، سلسلة اختيارية تمثل الضغط المراد استخدامه في ملف الإخراج ، القيم المسموح بها هي "gzip" ، "bz2" ، "xz" ، تُستخدم فقط عندما تكون الوسيطة الأولى عبارة عن اسم ملف line_terminator: string ، الافتراضي ' n' حرف السطر الجديد أو تسلسل الأحرف المراد استخدامه في اقتباس ملف الإخراج: ثابت اختياري من الإعدادات الافتراضية للوحدة النمطية csv إلى csv.QUOTE_MINIMAL. إذا قمت بتعيين float_format ، فسيتم تحويل العوامات إلى سلاسل وبالتالي سيعاملها csv.QUOTE_NONNUMERIC على أنها اقتباس غير رقمي: سلسلة (الطول 1) ، حرف '& quot' الافتراضي المستخدم لاقتباس الحقول المزدوجة: منطقي ، اقتباس True Control افتراضي لـ اقتباس داخل حقل escapechar: سلسلة (طول 1) ، افتراضي لا يوجد حرف مستخدم للهروب من sep و quotechar عندما يكون حجم القطع مناسبًا: عدد الصفوف int أو None للكتابة في وقت واحد. tupleize_cols: منطقي ، افتراضي خطأ

مهملة منذ الإصدار 0.21.0: ستتم إزالة هذه الوسيطة وستكتب دائمًا كل صف من الفهارس المتعددة كصف منفصل في ملف CSV.

اكتب أعمدة MultiIndex كقائمة من المجموعات (إذا كانت صحيحة) أو بالتنسيق الموسع الجديد ، حيث يكون كل عمود MultiIndex عبارة عن صف في CSV (إذا كان خطأ).


يمكن أن تكون الحلقة الرئيسية الخاصة بك:

ليست هناك حاجة للآخر على الإطلاق لأنك لا تفعل أي شيء إذا لم أكن غريبًا.

أيضًا ، ليست هناك حاجة على الإطلاق لقائمتين. يكفي واحد فقط:

ثم باقي البرنامج كما كتبته.

هذا حل لا يستخدم القوائم ، ويمر عبر الإدخال مرة واحدة فقط.

أحد التغييرات الطفيفة الأخرى التي يمكنك إجراؤها ، هو مجرد تكرار نطاق عدد المرات التي تريد فيها مطالبة المستخدم بالبيانات:

لا حاجة لإنشاء متغير إضافي وزيادته هنا.

2c الخاص بي: على الرغم من أنني لا أعرف بناء جملة Python جيدًا ، فإليك فكرة تحسين ستكون أكثر أهمية نظرًا لمجموعة بيانات أكبر (كثيرًا).

لا تحتاج إلى أي قوائم على الإطلاق. في الجزء الخارجي من الحلقة ، قم بتعريف متغير "أقصى فردي" ، يساوي في البداية -1. في الجزء الداخلي من الحلقة ، عندما يتم إدخال رقم ، إذا كان فرديًا وأكبر من maxOdd ، فقم بتعيين maxOdd مساويًا لهذا الرقم. هذا لا يتطلب ذاكرة تقريبًا ، في حين أن إنشاء قائمة ثم العمل عليها يتسع خطيًا في الذاكرة (ليس جيدًا).