أزهى طلال محمد | علوم الحاسوب |
الخلاصة
التعهيد الجماعي هو مصطلح شائع يطلق على البيئات التعاونية التي تتضمن مجموعة من المشاركين في صناعة محتوى هذه المنصات وانشاء المعرفة . من أهم وأشهر منصات التعهيد الجماعي هي Amazon’s Mechanical Turk و Kaggle و Wikipedia.
تعتبر ويكيبيديا واحدة من أكثر نماذج التعهيد الجماعي حيوية، حيث يساهم المستخدمون في إنشاء المقالات وتحريرها. مما أدى إلى موسوعيتها الامر الذي جعلها واحدة من أكثر المواقع زيارة للحصول على المعلومات أو استخدامها كقاعدة معرفية للعديد من التطبيقات مثل روبوتات الدردشة. كل هذه الخصائص المميزة يمكن للمستخدمين استغلالها سلباَ في تغيير محتواها، وهو ما يعرف بالتخريب.
التخريب هو أي محاولة لتعديل المقال بشكل يؤثر سلبًا على جودة المقالة. يعتبر التخريب أحد الطبقات الخمس للنموذج الذي تم إنشاؤه لوصف التهديدات السبرانية ، وهو ما يعرف بالتخريب السيبراني.
بشكل عام، فأن “التخريب السيبراني” هو فعل إتلاف أو إضرار البيانات بدلاَ عن سرقتها أو إساءة استخدامها. تم تطوير العديد من تقنيات الكشف التلقائي والميزات ذات الصلة لمعالجة هذه المشكلة.
تقدم هذه الأطروحة نموذجًا للتعلم العميق بهندسة معمارية جديدة لحل مشكلة التخريب في مقالات ويكيبيديا. يستخدم النموذج المقترح شبكة عصبية تلافيفية أحادية البعد (1D CNN) لتحديد نوع التعديلات التي تتم على مقالات ويكيبيديا هل هي تعديلات ( عادية أو تخريبية ) ، وفي الوقت نفسه ، تم استخراج ميزات جديدة واعتمادها في العمل ، مما ساهم في تحسين دقة النموذج . حيث أجريت التجارب على مجموعة بيانات معيارية ، مجموعة PAN-WVC-2010 من مسابقة الكشف عن التخريب التي استضافت في مؤتمر CLEF. بلغت الدقة التي حققها النظام المقترح بالمميزات الجديدة 96٪.