הפרויקט נועד לעצב מודל בינה מלאכותית, שינבא את שיעור הנשירה של הסטודנטים באוניברסיטה באחוזים.
מסרנו את הפרויקט הזה לאוניברסיטה שבסיסה בשוודיה. אוניברסיטה זו הבחינה כי מספר רב של סטודנטים לא סיימו את לימודיהם. רצינו לעצב פתרון שיסייע לפקח ולבסוף לעזור להפוך את המגמה הזו.
משך הזמן שבילינו על הפרויקט
טכניקות למידה של מכונה
הבחירה של אלגוריתם למידה היא אחד השלבים החשובים ביותר של הלמידה המכונה החלטנו להשתמש באלגוריתם היער האקראי בפרויקט. זהו סוג של אלגוריתם שמבצע חישובים אינטנסיביים מאוד. במילים אחרות, מדובר בשיטת למידה לסיווג ולרגרסיה שפועלת על ידי בניית מספר רב של עצי החלטה על סמך קבוצת נתונים אקראית.
גודל מסד הנתונים - מספר התצפיות
שפות ומסגרות המשמשות בפרויקט

כתוצאה מכך, מודל של למידה ממוחשבת נבנה, המסוגל לחזות את הסיכון של נשירה של תלמיד על ידי ניתוח הפעילות הסטודנטית הנתונה בפלטפורמת למידה.
המשימה הקשה ביותר במהלך האירוסין עם נתונים הייתה ההבנה המלאה של הבריאה של הגדרת הבעיה המלאה (כלומר, אילו נתונים מודיעים לנו על הישגי התלמידים ומצביעים על כישלון התלמידים). אתגר נוסף היה להכין מערך נתונים, משום שמערכת הנתונים העצומה שניתנה לנו על ידי הלקוח הייתה צריכה לנקות ולשלם.
החלטנו לקחת בחשבון לא רק את סך הפעילות הסטודנטיאלית בפורטל למידה ברגע השלמת הקורס, אלא גם לעקוב אחר הפעילויות וההישגים של התלמיד במהלך מפגשי קורס קצרים יותר.
הצוות שלנו השקיע מאמץ אמיתי להגיע ליבת הנתונים, ולהבין את הבעיה אשר היה לנו לפתור.
הוקמה בעיית מחקר מקיפה. מערכת הניקוי והניקוי נותחה ביסודיות. על בסיס זה, בחרנו את התכונות המתאימות ביותר ואת המודל הטוב ביותר, אשר נבדק מאוחר יותר אופטימיזציה.
האתגר התברר כהצלחה גדולה. הצלחנו לבנות את האלגוריתם, אשר מסוגל לחזות את הסיכון לנשירה קורס הקורס עם הסתברות של יותר מ -90%.