概要
電気通信大学では2015年という早い時期からデータサイエンスの講座「データアントレプレナーフェロープログラム」を開講してます。その成果をより広く活用いただくために、2021年度より社会人向けデータサイエンス・リスキリング講座「ゼロから始めるデータサイエンティスト養成講座」を開講、翌年2022度からは、基礎をしっかりと身につけたいという方のため「データサイエンス基礎講座」(3ヶ月間)、手を動かし、実践的な演習をこなす基礎から応用までを身につける「独り立ちデータサイエンティスト養成講座」(6ヶ月間) を開講しています。
『実学を学び世の中を変える』という理念のもと、これからの時代に役立つ真のスキルを身につけることができる社会人対象の講座です。
机上の空論よりも実践的な演習を行います。
必須のスキルをしっかり身につける3ヶ月間の「データサイエンス基礎講座」、手を動かし、実践的な演習をこなす基礎から応用までを身につける半年間の「独り立ちデータサイエンティスト養成講座」、どちらの講座も凝縮されたハードなカリキュラムをこなしながらしっかりと学び、実務に直結するデータサインティストを目指します。
確実に『戦力』となる人材を育成します。
企業等でデータ分析に携わる方、データサイエンスの『見習いレベル』から『独り立ちできるレベル』に実力を引き上げたい方、豊富なビジネス経験を生かして今後の方向性を模索している方、新しい可能性を拓きたいという方向けの講座です。
NEW! 「データサイエンス基礎講座」(春コース)
修了生の声 を掲載いたしました。
2024年度カリキュラム(案)
スケジュール
必修講義:基礎演習(eラーニング)
コンピュータサイエンス
データサイエンスで用いられる種々の手法を理解するために必要不可欠な、コンピュータサイエンスの基礎について学習する。最初にコンピュータサイエンスという学門分野について概説した後、アルゴリズムの概念を学習し、最大公約数、因数分解、ベキ乗の計算アルゴリズムについて概観する。次に、合同式、有限体、フェルマーの小定理について学んだ後、RSA公開鍵暗号、電子署名などへの応用について解説する。グラフ理論に関しては、幅優先探索、パスと連結成分、根付き木などについて学習した後、スモール・ワールド現象について触れる。最後に、計算量理論の基礎を学ぶ。具体的には、計算時間の測り方、多項式時間アルゴリズム、計算時間の爆発的増加などの概念について学習した後に、P = NP ? 問題、ビットコイン、量子コンピュータに関する話題を紹介する。
全10回
1.アルゴリズム 1 コンピュータサイエンスとは、アルゴリズムとは、最大公約数の計算、ユークリッドの互除法
2.アルゴリズム 2 因数分解アルゴリズム、ベキ乗の計算、ベキ乗の計算時間、因数分解の難しさ
3.整数論 1 合同式、合同式の代数、代数の基本的問題
4.整数論 2 ユークリッドの互除法、最大公約数に関する定理、有限体、フェルマーの小定理
5.公開鍵暗号 公開鍵暗号、RSA公開鍵暗号、電子署名
6.グラフ理論 1 グラフの定義、パスと連結性、根付き木
7.グラフ理論 2 グラフの幅優先探索、連結成分、複雑ネットワーク解析
8.計算量理論 1 計算時間の測り方、多項式時間アルゴリズム、計算時間の爆発的増加
9.計算量理論 2 クリーク問題、クリーク問題の計算量、P = NP ? 問題
10.計算量理論 3 NP 完全問題、ビットコイン、量子コンピュータ
Pythonプログラミング
データサイエンスで必要となるプログラミング言語Pythonの基礎を学習し、実習によって習得する。プログラミング言語Pthonの文法を学んだ後、制御スクリプトやオブジェクト指向の考え方と記法へと進む。データ分析に必要なモジュールを解説した後、可視化を行い、最後に総演習を行う。プログラミング言語Pythonを一通り学びます。
全10回
1. Python 実験環境の構築
2. Python を使ってみよう インタープリタシェル、変数,文字列,リストなどのデータ構造、各種演算処理
3. スクリプトとしてのPython 1 インタープリタからスクリプトへ、制御構造の書き方とインデント
4. スクリプトとしてのPython 2 関数の書き方と使い方、変数のスコープ
5. オブジェクト指向言語としての Python クラスの書き方と使い方、インスタンスの生成
6. モジュールの概要と import 1 標準モジュール解説、OSへのインタフェース, 文字列のパターンマッチング, 数学、インターネットへのアクセス, 日付と時刻, データ圧縮、パフォーマンスの計測, 品質管理
7. モジュールの概要と import 2 科学技術計算のためのモジュールnumpy, scipy, matplotlib, pandasの概要紹介、
8. numpy 概要と matplotlib による可視化
9. scipy 概要とデータ解析
10. 総合問題
必修講義:基礎演習(ライブ配信)
ITリテラシ
データを使って仕事をするための基本的なリテラシーを身につけていただきます。
- ssh通信を使ったリモート・サーバへのアクセス
- 文字コードと正規表現
- TCP/IPとhtml概論
- GitやGit Hubの利用
- SQL入門
Python100本ノック
一般社団法人データサイエンティスト協会が公開している「データサイエンス100本ノック(構造化データ加工編)」を活用して自習していただきます。質問等をSlackで受け付け、学習を進めます。
EDAとモデル作成の基礎
Pythonを使ってのデータの集計・可視化と機械学習の基礎を学びます。
- pandasによるデータ集計
- データの可視化とデータ構造
- モデルの精度と評価
- 判別モデル入門(titanicデータ)
- 回帰モデル入門(Jリーグ観客動員数予測)
NEW! 「独り立ちデータサイエンティスト養成講座」(春コース)
修了生の声 を掲載いたしました。
2024年度カリキュラム(案)
スケジュール
必修講義:基礎演習(eラーニング)
コンピュータサイエンス
データサイエンスで用いられる種々の手法を理解するために必要不可欠な、コンピュータサイエンスの基礎について学習する。最初にコンピュータサイエンスという学門分野について概説した後、アルゴリズムの概念を学習し、最大公約数、因数分解、ベキ乗の計算アルゴリズムについて概観する。次に、合同式、有限体、フェルマーの小定理について学んだ後、RSA公開鍵暗号、電子署名などへの応用について解説する。グラフ理論に関しては、幅優先探索、パスと連結成分、根付き木などについて学習した後、スモール・ワールド現象について触れる。最後に、計算量理論の基礎を学ぶ。具体的には、計算時間の測り方、多項式時間アルゴリズム、計算時間の爆発的増加などの概念について学習した後に、P = NP ? 問題、ビットコイン、量子コンピュータに関する話題を紹介する。
全10回
1.アルゴリズム 1 コンピュータサイエンスとは、アルゴリズムとは、最大公約数の計算、ユークリッドの互除法
2.アルゴリズム 2 因数分解アルゴリズム、ベキ乗の計算、ベキ乗の計算時間、因数分解の難しさ
3.整数論 1 合同式、合同式の代数、代数の基本的問題
4.整数論 2 ユークリッドの互除法、最大公約数に関する定理、有限体、フェルマーの小定理
5.公開鍵暗号 公開鍵暗号、RSA公開鍵暗号、電子署名
6.グラフ理論 1 グラフの定義、パスと連結性、根付き木
7.グラフ理論 2 グラフの幅優先探索、連結成分、複雑ネットワーク解析
8.計算量理論 1 計算時間の測り方、多項式時間アルゴリズム、計算時間の爆発的増加
9.計算量理論 2 クリーク問題、クリーク問題の計算量、P = NP ? 問題
10.計算量理論 3 NP 完全問題、ビットコイン、量子コンピュータ
Pythonプログラミング
データサイエンスで必要となるプログラミング言語Pythonの基礎を学習し、実習によって習得する。プログラミング言語Pthonの文法を学んだ後、制御スクリプトやオブジェクト指向の考え方と記法へと進む。データ分析に必要なモジュールを解説した後、可視化を行い、最後に総演習を行う。プログラミング言語Pythonを一通り学びます。
全10回
1. Python 実験環境の構築
2. Python を使ってみよう インタープリタシェル、変数,文字列,リストなどのデータ構造、各種演算処理
3. スクリプトとしてのPython 1 インタープリタからスクリプトへ、制御構造の書き方とインデント
4. スクリプトとしてのPython 2 関数の書き方と使い方、変数のスコープ
5. オブジェクト指向言語としての Python クラスの書き方と使い方、インスタンスの生成
6. モジュールの概要と import 1 標準モジュール解説、OSへのインタフェース, 文字列のパターンマッチング, 数学、インターネットへのアクセス, 日付と時刻, データ圧縮、パフォーマンスの計測, 品質管理
7. モジュールの概要と import 2 科学技術計算のためのモジュールnumpy, scipy, matplotlib, pandasの概要紹介、
8. numpy 概要と matplotlib による可視化
9. scipy 概要とデータ解析
10. 総合問題
統計検定2級自習
統計検定2級合格を支援するeラーニングです。現在、このレベルの確率・統計については優れた教材がインターネットで簡単に無料で手に入りますので、本講座では推薦サイトや推薦図書を紹介し講義は行わず、学習のガイドとして質問を受け付けるSlackと、理解度を確かめるための問題をご提供します。
必修講義:基礎演習(ライブ配信)
ITリテラシ
データを使って仕事をするための基本的なリテラシーを身につけていただきます。
- ssh通信を使ったリモート・サーバへのアクセス
- 文字コードと正規表現
- TCP/IPとhtml概論
- GitやGit Hubの利用
- SQL入門
Python100本ノック
一般社団法人データサイエンティスト協会が公開している「データサイエンス100本ノック(構造化データ加工編)」を活用して自習していただきます。質問等をSlackで受け付け、学習を進めます。
EDAとモデル作成の基礎
Pythonを使ってのデータの集計・可視化と機械学習の基礎を学びます。
- pandasによるデータ集計
- データの可視化とデータ構造
- モデルの精度と評価
- 判別モデル入門(titanicデータ)
- 回帰モデル入門(Jリーグ観客動員数予測)
必修講義:実データによる実践的演習(ライブ配信)
回帰モデル作成
ワシントンDCの不動産物件価格予想問題に取り組む中で、回帰分析に必要な事項を基礎から学びます。グループに分かれて、モデルの精度を競います。講義のほか、実習が中心となります。
判別モデル作成
小売店舗における購買行動データを用いた二値分類モデル(ある商品に関心を示す人/示さない人を判別するモデルを予定)を作っていただきます。本講義に使用するデータはコンソーシアム参画機関であるコニカミノルタ株式会社が独自に取得したもので、マーケティングに直結する実用性の高いデータです。
選択講義:実データによる実践的演習(ライブ配信)
デザイン思考
既存のものの単なる「改善」ではない、「新しい」モノやコトを作るということはどういうことなのかを学びます。「新しい」モノやコトを作り出すためのマインドセットを、多くの事例や演習で学びます。
データサイエンティストによるモック(MVP)作成
本講義では、エンドユーザの迅速なフィードバックを得ることを目的として、Streamlitなどを使うことでデータサイエンティスト単独で簡単に動くモックを作成する方法を紹介します。
選択講義(オンデマンド配信)
自然言語処理 基礎編
自然言語処理に取り組む上でのベースとなる、前処理についてご説明した後に応用篇のガイドを行います。スライド資料とノートブックによる演習を使って講義します。
自然言語処理 応用編
自然言語処理の発展的課題として、LDAによるトピックモデル、Word2Vec、BERTについて学びます。ライド資料とノートブックによる演習を使って講義します。
因果推論
講義資料を使って、因果推論についての基礎的な知識を学びます。
深層学習の基礎
進化のスピードの速い、この分野において、長く使える普遍的な考え方を身につけることを目的としています。講義資料と演習によって、理論的背景を数式からコードに書き起こすことで、理解を深めます
レコメンドモデル作成
講義と演習教材によって、レコメンドモデルを作っていただきます。演習で使用するデータの多くはオープンデーターですが、一部、企業様からご提供のデータを使用いたします。
教師なし学習の基礎と演習
本講座では、EDAと教師あり学習に加えて、分析の幅を広げるうえで有効な「教師なし学習」を扱います。項目としては、クラスタリング、次元圧縮、埋め込み、異常検知の各種手法の紹介と、現場での教師なし学習の適用を想定した演習問題を扱います。
修了生の声
「データサイエンス基礎講座」(2022年 春コース)
期待していたことは実現されたでしょうか?
満足しています。
データ分析に関する基礎的な知識てあるpythonを身につけるためのきっかけを作ること。データ分析で最低限お金がもらえる知識や技能の範囲を知ること。を期待して受講しました。
1つ目については、python100本ノックがよかったです。自分でもその後、類本を購入して1日2問解くことを続けています。
2つ目については、先生がスラックに提供していただいた話から、伺い知れることができましたし、また、参加するメンバーでの会話などからもわかりました。
丁寧な授業も勉強になりました。SQLやUNIX系のスキルはもともと持っているので、あとは統計の理解を深めることと、機械学習の基本をマスターすることだなと思っています。(男性 U.Eさん)
プログラミングをゼロから始めて,3か月間で一応はコンペに投稿できるレベルまで成長できたのは、ひとえに先生の愛ある厳しいご指導の賜物と深謝申し上げます。コーディングについては、まだまだ手が勝手に動くレベルには至っておりませんので、引き続き100本ノックの復習やこれと並行してコンペへの投稿に精進してまいりたいと存じます。(男性 T.Eさん)
pythonについてはほぼ初心者の状態だったが、それなりに使えるレベルになったので、これには満足しています。(男性 S.Yさん)
今後もデータサイエンスを学び続けますか?
学びたいと思います。
今回の3ヶ月の教材を再度復習する。および進められた本を読んで自学する。「統計検定2級」と「Python 3 エンジニア認定データ分析試験」の試験に合格する。本講座中も勉強していたので、これから試験の申込みをします。3ヶ月で短かったので、参加メンバーとの関わりが少なかったのが残念です。来年「統計検定2級」を持って再度受講させていただければと思います。(男性 U.Eさん)
学び続けたいと考えております。
今後は、自分のキャリアやビジネス上の課題などを踏まえ、勉強を続けたいと思いますが、今回学んだ事だけでも多く出来ることはあると思いますので、日頃の仕事でどう活かせるかを考える。実際に試してみる。で試行錯誤してみたいと思っております。
初学者かつ、仕事や今までの経験・学習経験のない自分にとっては3ヶ月でまずはスタートできるいいプログラムだったと感じております。次のステップにどう活かすかなどのヒントにもなりました。(Hさん・製薬会社勤務営業職)
感想など
2022年 春コース修了生:Hさん(製薬会社勤務営業職)
自身のスキルアップ、また自分のビジネスに使えるヒントを手に入れるために、データサイエンスとしての基礎知識や、必要なスキルを学ぶために申し込みました。
自分にとっては、初めてのジャンルの学びという事もあり、いい意味の厳しさもある一方、身につくものも多かったと感じております。
講師の方がお話しされている事も大変共感できるものが多く、知識云々というより、そもそもどういった目的で?何をしたいか?のような課題意識の持ち方、またその目的を見据えた上ですぐに手を動かしていける能力がないと前に進めないので、このようなカリキュラムになっているという事も自分にとっては理解しやすいやり方でした。
今後は、自分のキャリアやビジネス上の課題などを踏まえ、勉強を続けたいと思いますが、今回学んだ事だけでも多く出来ることはあると思いますので、日頃の仕事でどう活かせるかを考える。実際に試してみる。で試行錯誤してみたいと思っております。
初学者かつ、仕事や今までの経験・学習経験のない自分にとっては3ヶ月でまずはスタートできるいいプログラムだったと感じております。次のステップにどう活かすかなどのヒントにもなりました。
2022年 春コース修了生:Sさん
週1回の講義とはいえ、仕事をしながらでしたので中々タフな3か月でした。まだまだ学ばなければならないことは多いと感じたので3か月では足りないとも思いました。今よりレベルアップするためにも来年の募集でも応募できればと思っているが、自身の仕事量などとも相談しながら検討しようと思います。「統計検定2級」はトライしてみようと思います。(男性 S.Yさん)
NEW!
「独り立ちデータサイエンティスト養成講座」(2022年 春夏コース)
感想など
2022年 春夏コース修了生:Hさん(福岡県在住)
この講座はデータサイエンスの世界の扉を開いてくれました。沢山の教材は世に溢れているけれど、文系プログラマーの自分には独学での限界もありました。前提となる知識や体系的な事柄、また「得た知識をどう活用するか」については、どっぷりその世界に浸かった方がいい、と思い受講しました。
結果大正解でした。
みっちり学んだ半年は本当に濃く、社会に出てここまでの成長曲線を描ける事って中々無いように思います。
最終的にはチームで取り組む演習で組んだメンバーとも非常に仲良くなり、感動する授業もあり、データサイエンスの面白さ、奥深さにのめり込む、純粋に楽しく意義のある時間でした。
サポートしてくださった先生方本当にありがとうございました。
2022年 春夏コース修了生:Wさん(神奈川県在住)
この講座を受けてみてよかったことは、まずはデータに対する見方が変わったことです。日頃のニュースなどの調査結果を見る時に、「これは統計的にどうなんだろう ?? 差があると書いてあるけど検定はされているのだろうか ?? 」などと、今までだったら信じ切ってしまっていた情報を統計的に信頼できる内容なのかじっくり考えるようになりました。講座の中では、データの処理に使うpythonを学習したり、知識面では統計の勉強が必要だったり学ぶことは多いですが得るものも多かったです。グループワークでは、手を動かさないとチームメンバーの進捗にも影響が出るという状況で、疑問を解消ながら分析を進めていくモチベーションにもなりました。講座が修了する頃には、pythonでコードが書けるようになり統計検定2級を取得でき、簡単なデータ分析ができるようになりました。独学で勉強していたら、ここまではできなかったと思います。
2022年 春夏コース修了生:Mさん(神奈川県在住)
45歳の高校の数学科教員です。周りは企業のエンジニアや、大学院の学生ばかりで、少し心細い気持ちでおりましたが、周りも同じような気持ちを持っていたと後程知る機会があり、少しほっとしました。受講前に比べ、圧倒的に技術も知識も増え、大学卒業以来の達成感を味わうことができました。
また、教育の現場に生かすという当初の学習の動機から、いつの間にか純粋に学習を楽しむことができました。内容は本当に難しいですが、背伸びをしてでも必死に先生方についていくと必ず新たな世界が開けると思います。