120 Normal 0 false false false EN-US X-NONE AR-SA /* Style Definitions */ table.MsoNormalTable {mso-style-name:"Table Normal"; mso-tstyle-rowband-size:0; mso-tstyle-colband-size:0; mso-style-noshow:yes; mso-style-priority:99; mso-style-parent:""; mso-padding-alt:0cm 5.4pt 0cm 5.4pt; mso-para-margin-top:0cm; mso-para-margin-right:0cm; mso-para-margin-bottom:8.0pt; mso-para-margin-left:0cm; line-height:107%; mso-pagination:widow-orphan; font-size:11.0pt; font-family:"Calibri",sans-serif; mso-ascii-font-family:Calibri; mso-ascii-theme-font:minor-latin; mso-hansi-font-family:Calibri; mso-hansi-theme-font:minor-latin; mso-bidi-font-family:Arial; mso-bidi-theme-font:minor-bidi; mso-ansi-language:EN-US; mso-fareast-language:EN-US;}
التعامل مع القيم المتطرفة في البيانات عند استخدام نموذج kriging لاستيفاء الأسطح
د. محمد ناصف
120 Normal 0 false false false EN-US X-NONE AR-SA /* Style Definitions */ table.MsoNormalTable {mso-style-name:"Table Normal"; mso-tstyle-rowband-size:0; mso-tstyle-colband-size:0; mso-style-noshow:yes; mso-style-priority:99; mso-style-parent:""; mso-padding-alt:0cm 5.4pt 0cm 5.4pt; mso-para-margin-top:0cm; mso-para-margin-right:0cm; mso-para-margin-bottom:8.0pt; mso-para-margin-left:0cm; line-height:107%; mso-pagination:widow-orphan; font-size:11.0pt; font-family:"Calibri",sans-serif; mso-ascii-font-family:Calibri; mso-ascii-theme-font:minor-latin; mso-hansi-font-family:Calibri; mso-hansi-theme-font:minor-latin; mso-bidi-font-family:Arial; mso-bidi-theme-font:minor-bidi; mso-ansi-language:EN-US; mso-fareast-language:EN-US;}
سأل أحد طلاب العلم من دولة ليبيا عن التعامل مع القيم المتطرفة (الشاذة) في البيانات عند استخدام نموذج Kriging لاستيفاء الأسطح، فذكرني أحد الأحبة في التعليقات للرد والإجابة، وتمت الإجابة كالتالي:
المشكلة التي تواجه السائل كما موضح بالصورتين المرفقتين من طرفه هي تجاهل القيم المتطرفة للعينات في منطقة الدراسة عند استخدام طريقة Kriging وعدم ظهورها في السطح الناتج لعملية التنبؤ Prediction
120 Normal 0 false false false EN-US X-NONE AR-SA /* Style Definitions */ table.MsoNormalTable {mso-style-name:"Table Normal"; mso-tstyle-rowband-size:0; mso-tstyle-colband-size:0; mso-style-noshow:yes; mso-style-priority:99; mso-style-parent:""; mso-padding-alt:0cm 5.4pt 0cm 5.4pt; mso-para-margin-top:0cm; mso-para-margin-right:0cm; mso-para-margin-bottom:8.0pt; mso-para-margin-left:0cm; line-height:107%; mso-pagination:widow-orphan; font-size:11.0pt; font-family:"Calibri",sans-serif; mso-ascii-font-family:Calibri; mso-ascii-theme-font:minor-latin; mso-hansi-font-family:Calibri; mso-hansi-theme-font:minor-latin; mso-bidi-font-family:Arial; mso-bidi-theme-font:minor-bidi; mso-ansi-language:EN-US; mso-fareast-language:EN-US;}
بداية أود أن أشير أن التحليل الجيواحصائي يتعامل معه الكثير ببساطة أقرب إلى الإهمال على أنه مجموعة نقاط يتم من خلالها استيفاء الأسطح عبر عدة نقرات على الأزرة! التحليل الجيواحصائي يُدرس ككورس كامل في الجامعات الغربية تحت مسميات مختلفة منها Applied Geostatistics ، Geostatistical Analysis وهو تخصص قائم بذاته في كثير من الجامعات تحت مسمى Geostatistics. وبالتالي كل فترة تصدر طرق جديدة للاستيفاء المكاني وتطوير للطرق القديمة وحل لمشكلات تقابل المستخدمين وهذه المشكلات هي ما يتم مناقشتها وإيجاد حلول لها من قبل المتخصصين في علوم التقنيات المكانية وسنلاحظ ذلك جيدًا عند فحص أدوات التحليل الجيواحصائي في إصدارات ال ArcGIS لشركة ESRI.
120 Normal 0 false false false EN-US X-NONE AR-SA /* Style Definitions */ table.MsoNormalTable {mso-style-name:"Table Normal"; mso-tstyle-rowband-size:0; mso-tstyle-colband-size:0; mso-style-noshow:yes; mso-style-priority:99; mso-style-parent:""; mso-padding-alt:0cm 5.4pt 0cm 5.4pt; mso-para-margin-top:0cm; mso-para-margin-right:0cm; mso-para-margin-bottom:8.0pt; mso-para-margin-left:0cm; line-height:107%; mso-pagination:widow-orphan; font-size:11.0pt; font-family:"Calibri",sans-serif; mso-ascii-font-family:Calibri; mso-ascii-theme-font:minor-latin; mso-hansi-font-family:Calibri; mso-hansi-theme-font:minor-latin; mso-bidi-font-family:Arial; mso-bidi-theme-font:minor-bidi; mso-ansi-language:EN-US; mso-fareast-language:EN-US;}
توصيف المشكلة وسبب الخطأ
120 Normal 0 false false false EN-US X-NONE AR-SA /* Style Definitions */ table.MsoNormalTable {mso-style-name:"Table Normal"; mso-tstyle-rowband-size:0; mso-tstyle-colband-size:0; mso-style-noshow:yes; mso-style-priority:99; mso-style-parent:""; mso-padding-alt:0cm 5.4pt 0cm 5.4pt; mso-para-margin-top:0cm; mso-para-margin-right:0cm; mso-para-margin-bottom:8.0pt; mso-para-margin-left:0cm; line-height:107%; mso-pagination:widow-orphan; font-size:11.0pt; font-family:"Calibri",sans-serif; mso-ascii-font-family:Calibri; mso-ascii-theme-font:minor-latin; mso-hansi-font-family:Calibri; mso-hansi-theme-font:minor-latin; mso-bidi-font-family:Arial; mso-bidi-theme-font:minor-bidi; mso-ansi-language:EN-US; mso-fareast-language:EN-US;}
وجود قيم متطرفة في العينات المأخوذة من منطقة دراسة تزيد أو تقل قيمتها عن قيم عينات منطقة الدراسة بمقدار كبير يزيد عن الضعف وأكثر. تنتج هذه القيم المتطرفة عن أعطال في المعدات والأجهزة أو خطأ مطبعي أثناء إدخال البيانات، ولكن ليست كل القيم المتطرفة نتيجة خطأ ما فربما تكون قيم صالحة وموثوقة وتمت مراجعتها أكثر من مرة وقياسها عدة مرات وهذا هو النوع الذي يواجهه السائل في منطقة دراسته بلبيا ولا يمكن حذف هذه القياسات أو تجاهلها طالما تم التأكد منها و سنعرض الحل له لإنشاء خريطة تنبؤات لمنطقة دراسته تتضمن القيم المتطرفه باستخدام نموذج kriging كالتالي:
120 Normal 0 false false false EN-US X-NONE AR-SA /* Style Definitions */ table.MsoNormalTable {mso-style-name:"Table Normal"; mso-tstyle-rowband-size:0; mso-tstyle-colband-size:0; mso-style-noshow:yes; mso-style-priority:99; mso-style-parent:""; mso-padding-alt:0cm 5.4pt 0cm 5.4pt; mso-para-margin-top:0cm; mso-para-margin-right:0cm; mso-para-margin-bottom:8.0pt; mso-para-margin-left:0cm; line-height:107%; mso-pagination:widow-orphan; font-size:11.0pt; font-family:"Calibri",sans-serif; mso-ascii-font-family:Calibri; mso-ascii-theme-font:minor-latin; mso-hansi-font-family:Calibri; mso-hansi-theme-font:minor-latin; mso-bidi-font-family:Arial; mso-bidi-theme-font:minor-bidi; mso-ansi-language:EN-US; mso-fareast-language:EN-US;}
توقيت ظهور المشكلة:
120 Normal 0 false false false EN-US X-NONE AR-SA /* Style Definitions */ table.MsoNormalTable {mso-style-name:"Table Normal"; mso-tstyle-rowband-size:0; mso-tstyle-colband-size:0; mso-style-noshow:yes; mso-style-priority:99; mso-style-parent:""; mso-padding-alt:0cm 5.4pt 0cm 5.4pt; mso-para-margin-top:0cm; mso-para-margin-right:0cm; mso-para-margin-bottom:8.0pt; mso-para-margin-left:0cm; line-height:107%; mso-pagination:widow-orphan; font-size:11.0pt; font-family:"Calibri",sans-serif; mso-ascii-font-family:Calibri; mso-ascii-theme-font:minor-latin; mso-hansi-font-family:Calibri; mso-hansi-theme-font:minor-latin; mso-bidi-font-family:Arial; mso-bidi-theme-font:minor-bidi; mso-ansi-language:EN-US; mso-fareast-language:EN-US;}
يعتقد الكثير أن المشكلة تبدأ في الظهور في السطح الناتج والمراد التنبؤ به، ولكن المشكلة تبدأ (عند عملية النمذجة وقبل عملية التنبؤ بالسطح) عند إيجاد مخطط semivariogram يلائم بياناتك حيث تؤثر القيم المتطرفة بشكل كبير جدًا على باقي القيم مما يصعب إيجاد مخطط semivariogram يلائم جميع قيم البيانات التجريبية وكل مخطط تحاول الوصول إليه ليلائم بياناتك غير مقبول لأي تحليل جيد، وبالتالي قيمة كلا من ال Roote Mean Square Error و Average Standard Error ستكون كبيرة جدًا وغير مقبولة في نتائج التحليل للسطح المتنبأ به.
120 Normal 0 false false false EN-US X-NONE AR-SA /* Style Definitions */ table.MsoNormalTable {mso-style-name:"Table Normal"; mso-tstyle-rowband-size:0; mso-tstyle-colband-size:0; mso-style-noshow:yes; mso-style-priority:99; mso-style-parent:""; mso-padding-alt:0cm 5.4pt 0cm 5.4pt; mso-para-margin-top:0cm; mso-para-margin-right:0cm; mso-para-margin-bottom:8.0pt; mso-para-margin-left:0cm; line-height:107%; mso-pagination:widow-orphan; font-size:11.0pt; font-family:"Calibri",sans-serif; mso-ascii-font-family:Calibri; mso-ascii-theme-font:minor-latin; mso-hansi-font-family:Calibri; mso-hansi-theme-font:minor-latin; mso-bidi-font-family:Arial; mso-bidi-theme-font:minor-bidi; mso-ansi-language:EN-US; mso-fareast-language:EN-US;}
حل المشكلة:
120 Normal 0 false false false EN-US X-NONE AR-SA /* Style Definitions */ table.MsoNormalTable {mso-style-name:"Table Normal"; mso-tstyle-rowband-size:0; mso-tstyle-colband-size:0; mso-style-noshow:yes; mso-style-priority:99; mso-style-parent:""; mso-padding-alt:0cm 5.4pt 0cm 5.4pt; mso-para-margin-top:0cm; mso-para-margin-right:0cm; mso-para-margin-bottom:8.0pt; mso-para-margin-left:0cm; line-height:107%; mso-pagination:widow-orphan; font-size:11.0pt; font-family:"Calibri",sans-serif; mso-ascii-font-family:Calibri; mso-ascii-theme-font:minor-latin; mso-hansi-font-family:Calibri; mso-hansi-theme-font:minor-latin; mso-bidi-font-family:Arial; mso-bidi-theme-font:minor-bidi; mso-ansi-language:EN-US; mso-fareast-language:EN-US;}
نقوم بتقسيم عملية Kriging إلى قسمين القسم الأول سيحتوي عملية النمذجة والقسم الثاني سيحتوي عملية التنبؤ حيث في الجزء الأول (النمذجة) سيتم بناء مخطط semivariogram بعد إزالة القيم المتطرفة تمامًا بمعنى سيتم تعيين كل نقاط البيانات ما عدا نقاط القيم المتطرفة وسنستخرج طبقة تشمل كل نقاط البيانات عدا النقطتين الشاذتين. وفي عملية التنبؤ بالسطح يتم استخدام مجموعة البيانات كلها شاملة القيم المتطرفة وسيتم تطبيقهما بشكل منفصل تمامًا كيف ذلك؟ للفهم بشكل أفضل الخطوات بالتفصيل:
1- عملية النمذجة: عند بناء مخطط semivariogram اختر جميع نقاط بياناتك باستثناء القيم المتطرفة واختر مخطط semivariogram يلائم بياناتك المتضمنة بعد استبعاد القيم المتطرفة ثم اختر Finish ثم OK ستظهر الطبقة الناتجة أمامك قم بتسميتها مثلًا Modelling وإذا أردت حفظها فلا مانع من ذلك لأن هذه الطبقة سنستخدمها في عملية التنبؤ لاحقًا،
2- عملية التنبؤ: الآن سنستخدم طبقة Modelling الناتجة مسبقًا في عملية التنبؤ بالسطح، من geoprocessing tool نختار Create Geostatistical Layer في النافذة المنبثقة سنضع طبقة ال Modelling في خانة Input geostatistical model source ونضع طبقة النقاط (العينات) وحقل قيم البيانات في Input dataset وطبقة المخرجات في Output geostatistical layer ونسميها مثلًا Prediction.
كل ما فعلناه الآن أننا استنبطنا نموذجًا يلائم قيم البيانات مستبعدين القيم المتطرفه واستخدمنا هذا النموذج في التنبؤ بالسطح متضمنًا جميع البيانات بما فيها القيم المتطرفة، وستجد السطح الناتج متضمن القيم المتطرفة في منطقة الدراسة.
120 Normal 0 false false false EN-US X-NONE AR-SA /* Style Definitions */ table.MsoNormalTable {mso-style-name:"Table Normal"; mso-tstyle-rowband-size:0; mso-tstyle-colband-size:0; mso-style-noshow:yes; mso-style-priority:99; mso-style-parent:""; mso-padding-alt:0cm 5.4pt 0cm 5.4pt; mso-para-margin-top:0cm; mso-para-margin-right:0cm; mso-para-margin-bottom:8.0pt; mso-para-margin-left:0cm; line-height:107%; mso-pagination:widow-orphan; font-size:11.0pt; font-family:"Calibri",sans-serif; mso-ascii-font-family:Calibri; mso-ascii-theme-font:minor-latin; mso-hansi-font-family:Calibri; mso-hansi-theme-font:minor-latin; mso-bidi-font-family:Arial; mso-bidi-theme-font:minor-bidi; mso-ansi-language:EN-US; mso-fareast-language:EN-US;}
احتياطات يجب مراعاتها عند استخدام التحليل الجيواحصائي بشكل عام:
120 Normal 0 false false false EN-US X-NONE AR-SA /* Style Definitions */ table.MsoNormalTable {mso-style-name:"Table Normal"; mso-tstyle-rowband-size:0; mso-tstyle-colband-size:0; mso-style-noshow:yes; mso-style-priority:99; mso-style-parent:""; mso-padding-alt:0cm 5.4pt 0cm 5.4pt; mso-para-margin-top:0cm; mso-para-margin-right:0cm; mso-para-margin-bottom:8.0pt; mso-para-margin-left:0cm; line-height:107%; mso-pagination:widow-orphan; font-size:11.0pt; font-family:"Calibri",sans-serif; mso-ascii-font-family:Calibri; mso-ascii-theme-font:minor-latin; mso-hansi-font-family:Calibri; mso-hansi-theme-font:minor-latin; mso-bidi-font-family:Arial; mso-bidi-theme-font:minor-bidi; mso-ansi-language:EN-US; mso-fareast-language:EN-US;}
اختيار الطريقة المناسبة يعتمد على منطقة دراستك ووعورتها وطريقة توزيع العينات وشذوذ البيانات ومدى ملائمة المعادلة الرياضية للنموذج المستخدم لبياناتك. إذا قررت استخدام طريقة Kriging لابد أن تراعى في تحليلك أن الطريقة لها أنماط مختلفة مثل Simple Kriging, Ordinary Kriging, Universal Kriging وغير ذلك ...، وكل نمط له فرضيات ومعاملات مختلفة ستؤثر حتمًا على نتائجك. التأكد من توزيع مواقع أخذ العينات بشكل شبه منتظم في منطقة الدراسة وعلى مسافات شبه متقاربة كلما أمكن وأن تغطي مساحة منطقة الدراسة ولا تترك فراغات كبيرة دون أخذ عينات منها. يجب بناء مخطط semivariogram يلائم قيم بياناتك جيدً.
لا تنس أن تدون على خارطة السطح المتنبأ به قيم أخطاء التنبؤ مثل Roote Mean Square Error و Average Standard Error.
120 Normal 0 false false false EN-US X-NONE AR-SA /* Style Definitions */ table.MsoNormalTable {mso-style-name:"Table Normal"; mso-tstyle-rowband-size:0; mso-tstyle-colband-size:0; mso-style-noshow:yes; mso-style-priority:99; mso-style-parent:""; mso-padding-alt:0cm 5.4pt 0cm 5.4pt; mso-para-margin-top:0cm; mso-para-margin-right:0cm; mso-para-margin-bottom:8.0pt; mso-para-margin-left:0cm; line-height:107%; mso-pagination:widow-orphan; font-size:11.0pt; font-family:"Calibri",sans-serif; mso-ascii-font-family:Calibri; mso-ascii-theme-font:minor-latin; mso-hansi-font-family:Calibri; mso-hansi-theme-font:minor-latin; mso-bidi-font-family:Arial; mso-bidi-theme-font:minor-bidi; mso-ansi-language:EN-US; mso-fareast-language:EN-US;}
بالتوفيق وسداد الخطى