2024年度(令和6年度)対面学習Ⅲ-10「Kaggle講義」(ライブ配信)

2024年度 受講生専用ページです。

公開日:2024年xx月xx日

 

対面学習Ⅲ

(Ⅲ-10)Kaggle講義(ライブ配信)

対象:2024年度「データアントレプレナーフェロープログラム」「エキスパート・プログラム」受講生
準備:個々にウェブブラウザが使えるノートブックPCを準備ください。
日程:第1回 2024年11月  9日(土)13:00~18:00
   第2回 2024年11月16日(土)13:00~18:00
   第3回 2024年11月30日(土)13:00~18:00
   第4回 2024年12月  7日(土)13:00~18:00
   第5回 2024年12月14日(土)13:00~18:00

会場:オンライン開催 (※Slackで通知のZoomミーティングに5分前までにお入りください。)
担当教員:原田 慧教授
講師:パナソニック株式会社 阪田 隆司氏
申込:Slackの「Kaggle講義」のチャンネルで参加を宣言してください。
使用データと教材:上記のSlack「Kaggle講義」のチャンネルにアップします。

学習のテーマと使用データ

1)学習のテーマ:

「データサイエンス」という言葉に比べれば機械学習モデルの構築は狭い領域ですが、モデル構築一つとっても、データを見て実際に処理してみないとわからないことが多く、教科書にならない独特のノウハウがあります。このようなノウハウの習得には、座学だけではなく、自分でデータを見て、自分でコードを書いた、実践経験の積み重ねが不可欠です。Kaggleなどのコンペに参加することで、そのような職に就く前に擬似的な実践経験を積むことができます。ここでは各回座学1コマ、演習2コマで、コンペ形式の演習を通して、モデル構築の技術を体得していただきます。

参考図書:Kaggleで勝つデータ分析の技術(技術評論社、門脇・阪田・保坂・平松)

2)使用データ:
・講義の中で適宜指定します。データそのものは、Slackなどで共有します。

 

カリキュラム

日時内容講師その他調査票※
111/9(土)
13:00 - 18:00

機械学習モデリング入門
シンプルなデータでモデル構築の一連の流れを学びます。特徴量作成、GBDTモデルの構築とチューニング、モデルの検証方法(クロスバリデーションなど)、以後の講義で必要になる事項を含みます。
1限目:講義
2限目:演習
3限目:演習
原田 慧教授
阪田 隆司氏(パナソニック株式会社)
下記の事前準備をお願いします。

1)Kaggleにご自身のアカウント登録をお願いします。
https://www.kaggle.com/
211/16(土)
13:00 - 18:00

特徴量エンジニアリング
特徴量エンジニアリングは機械学習モデルの精度に対して非常に大きな影響を与え、表形式のデータを扱うコンペティションにおいては最も重要な要素の一つです。本講義では、特徴量エンジニアリングのテクニックを網羅的に紹介していきます。特に複数テーブルを組み合わせて分析を行う際の特徴量エンジニアリングやカテゴリ変数に対する処理を重点的に紹介します。
1限目:講義
2限目:演習
3限目:演習
原田 慧教授
311/30(土)
13:00 - 18:00

時系列データ処理
モデル構築の目的の多くは将来予測となります。データサイエンスが対象とするデータの多くは人間の社会行動、経済行動で、時間に伴い変化します。本講義では、特に時系列データを扱った際のモデルの検証方法や学習されたモデルの妥当性の検証方法について重点的に紹介します。
1限目:講義
2限目:演習
3限目:演習
原田 慧教授
阪田 隆司氏(パナソニック株式会社)
412/7(土)
13:00 - 18:00

レコメンデーション
推薦技術はビジネス価値につながるものも多く、コンペティションにおいても花形のひとつです。推薦問題に取り組む上では多用なアプローチが存在しており、本講義では幾つかの代表的なアプローチを紹介していきます。あわせて、ニューラルネットワークの学習手法に関する精度向上テクニックも本講義において紹介していきます。
1限目:講義
2限目:演習
3限目:演習
原田 慧教授
512/14(土)
13:00 - 18:00
マルチモーダルデータ処理
表形式のデータとテキストデータの両方を含む課題を扱います。テキストデータを単にカテゴリ変数として扱うだけでなく、自然言語処理の問題との複合問題として扱います。このような問題は「マルチモーダル」と言われ、画像や音声などにも同様の拡張が可能です。講義では自然言語処理と画像処理の代表手法を紹介していきます。
1限目:講義
2限目:演習
3限目:演習
原田 慧教授
阪田 隆司氏(パナソニック株式会社)

※調査票の回答
全5回の講義を受講後、上記フォームから調査票のご提出をお願いいたします。
・忌憚のない率直な評価、ご意見をお願いいたします。
・講師は記入者が分からないように完全匿名化されております。
・成績には全く影響いたしません。

 

その他

・録画したファイルを公開しますので、それを視聴して復習してください。なお、録画ファイルや公開した資料はご自身の学習のため以外には使用・公開なさらないようにお願いします。