GROUP EMOTION DETECTION IN A SMART SIMULATION SYSTEM

علي حسين موسى حمزة علوم حاسوب

الخلاصة

في مجال التفاعل بين الإنسان والروبوت (HRI)، تلعب القدرة على التعرف على المشاعر الإنسانية وفهمها دورًا أساسيًا في تسهيل التفاعل الاجتماعي. حيث إنه يمكن الاستفادة من تفاصيل التعرف على المشاعر الجماعية (GER) كأساس عملي لتحسين عمليات صنع القرار ضمن مبادئ عمل ال(HRI).
تتكون منهجية هذه الأطروحة من عدة خطوات لاتخاذ القرار الأفضل. في بادئ الأمر تم البحث عن مجموعة بيانات تشمل أطياف واسعة من تعابير الوجه العاطفية وسيناريوهات مختلفة لتجمع الأفراد. لذا فقد أعتمدت مجموعة بيانات مستمدة من بيئات محاكاة افتراضية للواقع الحقيقي كأساس رئيسي لتحليل تعابير الوجوه من خلال إستخدام طريقة منهجية لاكتشاف و تحديد الوجوه بشكل أولي ومن ثم أستنباط و تمييز التعابير، وذلك من خلال دمج مصنفات الــ(Haar و HOG )، لضمان تحديد الوجوه بشكل فعال. ثم استخراج العلامات المميزة لتعابير الوجه من خلال استخدام الـ(Dlib)، ولتعزيز الدقة في تحديد الوجه تم إستخدام الــ(MTCNN) .
يكمن جوهر هذا البحث في تطوير نموذج الشبكة العصبية التلافيفية (CNN)، المصمم لتصنيف دقيق للصور متعددة المشاعر طبقا لتعبيرات الوجه. حيث إنه يتيح نموذج الـ(Attention CNN) و الذي تم تدريبه على مجموعة البيانات المهيأة مسبقاً لكي يتمكن من التعرف الدقيق على المشاعر. و من ثم تم اختبار هذا النموذج على نوعين من البيانات الأساسية والثانوية. حيث إنه تم تحقيق دقة عالية عند إستخدامه على بيانات الــ(ROS/Gazebo Generated) الرئيسية محققا نسبة 98.5% لإستكشاف جميع فئات المشاعر الستة المقترحة (الغضب ، الإشمئزاز ، الخوف ، السعادة ، الحزن ، التفاجئ )، بينما حققت مجموعة بيانات الـ(RAF) الثانوية 66% من الدقة.
علاوة على ذلك، تم تطبيق الموديل على مجموعتين من الفيديوات صممت بواسطة برامج محاكاة لبيئتين واقعيتين هما (قاعة متحف و بناية كافيتيريا) ، حيث أنه تم تحويل هذه الفيديوات الى مجموعة إطارات وتم التعامل مع كل إطار على أنه صورة ، ليتم إستخدام نفس العمليات السابقة في تحديد الوجوه و إستنباط المشاعر لأفراد المجاميع ضمن هذه الصور.
بعد تحديد الوجوه و تعابيرها تم إعتماد مبدأ التوزيع المكاني لهذه الوجوه ومبدأ الأنتروبي لتوزيع مشاعر مجموعة من الافراد ضمن الصورة الواحدة ، و بعد دمج كل عشرة أطر لتشكل مشهد واحد ، يتم لاحقا وفق عمليات محددة تصنيف مشاعر المجموعة لكل إطار ضمن إحدى حالتين سلبية أو إيجابية تمهيدا لتمكين الروبوت من إتخاذ القرار المناسب في كيفية التعامل مع مجاميع الافراد ضمن البيئات التفاعلية الموجود فيها ضمن مفاهيم الـ(HRI) ، لتُظهر عملية التقييم فعالية النموذج وتحقيقه دقة عالية في التمييز بين المشاعر المختلفة لكل فرد واتخاذ قرارات مناسبة .