كان المشروع يهدف إلى تصميم نموذج ذكاء اصطناعي ، والذي من شأنه أن يتنبأ بمعدل التسرب من طلاب الجامعات.
قدمنا هذا المشروع لجامعة مقرها في السويد. لاحظت هذه الجامعة أن عددًا كبيرًا من الطلاب لم يكملوا دراستهم. أردنا أن نصمم حلاً من شأنه أن يساعد في مراقبة هذا الاتجاه في نهاية المطاف.
مقدار الوقت الذي قضيناه في المشروع
تقنيات التعلم الآلي
يعد اختيار خوارزمية التعلم إحدى أهم مراحل التعلم الآلي.
قررنا توظيف خوارزمية غابة العشوائية في المشروع. إنه نوع من الخوارزمية التي تقوم بحسابات مكثفة للغاية. بمعنى آخر ، إنها طريقة للتعلم للتصنيف والارتداد التي تعمل من خلال إنشاء عدد كبير من أشجار القرار استنادًا إلى مجموعة فرعية عشوائية من البيانات.
حجم قاعدة البيانات - عدد المشاهدات
اللغات والأطر المستخدمة في المشروع

نتيجة لذلك ، تم إنشاء نموذج التعلم الآلي ، وهو قادر على التنبؤ بخطر تسرب الطالب من خلال تحليل نشاط الطالب المعطى على النظام الأساسي للتعلم.
كانت أصعب مهمة خلال التفاعل مع البيانات هي الفهم الكامل وإنشاء تعريف المشكلة بالكامل (أي فهم البيانات التي تعلمنا بنجاح الطلاب والتي تشير إلى فشل الطلاب). كان هناك تحدٍ آخر يتمثل في إعداد مجموعة بيانات ، نظرًا لأن مجموعة البيانات الهائلة التي حصلنا عليها من العميل كانت بحاجة إلى التنظيف والمكملات.
لقد قررنا ألا نأخذ في الاعتبار فقط نشاط الطلاب الإجمالي على بوابة التعلم في لحظة اكتمال الدورة التدريبية ، ولكننا أيضًا راقبنا أنشطة الطالب وإنجازاته خلال فترات الدورات الدراسية الأقصر.
وضع فريقنا جهدًا حقيقيًا في الحصول على البيانات الأساسية ، وفهم المشكلة التي كان علينا حلها.
تم تحديد تعريف شامل لمشكلة البحث. تم تحليل مجموعة البيانات التي تم تنظيفها واستكمالها بدقة. على هذا الأساس ، اخترنا أكثر الميزات ملاءمة وأفضل نموذج ، والذي تم اختباره وتحسينه لاحقًا.
اتضح أن التحدي كان نجاحًا كبيرًا. تمكنا من بناء الخوارزمية ، التي يمكنها التنبؤ بخطر تسرب الطالب من الدورة التدريبية بأكثر من 90 في المائة من الاحتمالات.