معالجة القيم الشاذة في السلاسل الزمنية باستعمال نماذج البيانات المقطعية

منتظر مصطفى نصيف

     معالجة القيم الشاذة في السلاسل   الزمنية  باستعمال نماذج البيانات المقطعية       الماجستير في علوم الاحصاء

المستخلص

   أن وجود القيم الشاذة في اعداد المصابين بفيروس كورونا (كوفيد- 19 ) لشهر آب عام 2020 في العراق تؤثر على نتائج التحليل الاحصائي لهذه البيانات ، وهذه البيانات يمكن الحصول عليها من خلال المشاهدات المكررة  ( Repeated Observation ) لظاهرة ما حول N من المقاطع العرضية ( Cross-Sections ) خلال سلسلة زمنية T معينة ( Time series ) ، وتطرقت الرسالة الى تحليل البيانات المتعلقة بجائحة فيروس كورونا ( كوفيد -19 )  قبل تشخيص ومعالجة المشاهدات الشاذة باستعمال نماذج البيانات المقطعية المتمثلة في ( أنموذج التأثير الثابت و أنموذج التأثير العشوائي ) ، وثم تطرقت في هذه الدراسة الى تشخيص المشاهدات الشاذة في هذه البيانات بطرائق ( رسم الصندوق ، مصفوفة القبعة ، بواقي ستيودنت المحذوفة ) ، ومن ثم سبل معالجة هذه المشاهدات الشاذة بطرائق ( الحذف ، التحويلات اللوغارتمية ، تشذيب المشاهدات الشاذة ) ، وتم تحليل البيانات مرة أخرى بعد معالجة المشاهدات الشاذة باستعمال ( أنموذج التأثير الثابت و أنموذج التأثير العشوائي ) .

واظهرت النتائج في الجانب التطبيقي افضلية أنموذج التأثير الثابت قبل وبعد معالجة المشاهدات الشاذة عن أنموذج التأثير العشوائي من خلال استعمال اختبار (هوسمان Hausman) واختبار معامل التحديد (R2) واختبار المعنوية الكلية للأنموذج (F) ، واظهرت النتائج كذلك أن معالجة القيم الشاذة لم تحسن كفاءة وتقدير النماذج المستعملة ، واظهرت نتائج اختبار ديربن – واتسون (D.W) ان النماذج المستعملة تعاني من ارتباط ذاتي موجب بين الاخطاء العشوائية .