学生コースのドロップアウト予測
カテゴリー:機械学習

このプロジェクトは、大学院生のドロップアウト率をパーセンテージで予測する人工知能モデルを設計することでした。
私たちはスウェーデンに拠点を置く大学にこのプロジェクトを届けました。この大学は、多くの学生が勉強を終えていないことに気づいていました。私たちは、この傾向を監視し、ついにはこの傾向を逆転させるのに役立つソリューションを設計したいと思いました。

 
プロジェクトに費やした時間
alt
機械学習についての優れた知識を持つ私たちの素晴らしい、経験豊富なチームは、わずか6週間でプロジェクトを構築することができました。
正確さ
最後に、このモデルはコースドロップアウト予測で92%の精度を達成
%
機械学習テクニック

学習アルゴリズムの選択は、機械学習の最も重要な段階の1つです。
プロジェクトではランダムフォレストアルゴリズムを採用することにしました。それは非常に集中的な計算を実行する一種のアルゴリズムです。言い換えれば、それはデータのランダムなサブセットに基づいて多数の決定木を構築することによって機能する分類と回帰のための学習方法です。

alt
ランダムフォレストアルゴリズムは、そのために他のアルゴリズムと比較して最も効率的なアルゴリズムであることが証明されました。ビッグデータへの適合性とデータの断続性に対する鈍感性このアルゴリズムは、
0 ランダムな木
データベースサイズ - 観測数
初期観測数
0
データベース変換の結果として得られた観測数
0
プロジェクトで使用されている言語とフレームワーク

結果として、学習プラットフォームでの特定の生徒の行動を分析することで生徒のドロップアウトのリスクを予測できる、機械学習モデルが構築されました。

データとの関わり合いで最も困難な作業は、問題定義全体を完全に理解し作成することでした(つまり、どのデータが学生の成功について私たちに知らせ、学生の失敗を示すかを理解することです)。もう1つの課題は、データセットを準備することでした。クライアントから提供された膨大なデータセットには、クリーニングと補足が必要でした。

コース終了時のラーニングポータルでの生徒のアクティビティの合計だけでなく、より短いコース間隔で生徒のアクティビティと成果を監視することも検討しました。

私たちのチームは、データをコアにして解決するためにある問題を理解することに真剣に取り組んでいます。

包括的な研究課題の定義が確立されました。洗浄および補足されたデータセットは徹底的に分析されました。その理由から、私たちは最も適切な機能と最良のモデルを選びました。それは後でテストされ最適化されました。

挑戦は大成功でした。私たちは、90%以上の確率で学生のコース脱落のリスクを予測することができるアルゴリズムを構築することに成功しました。

競合他社に勝る競争上の優位性を得るために機械学習の恩恵を受けたいですか