慶應SFCで行われた「データ・ドリブン社会の創発と戦略」の授業構成が秀逸すぎる
やっぱり一流の教授が構成する授業は素晴らしいですね。社会人でデータ関係に携わる人はほぼこれができれば十二分なのではないでしょうか。こういう内容を完璧にするだけで、社会人としては十二分の価値を出せるわけです。
Statistics Hacks ―統計の基本と世界を測るテクニックhttps://t.co/kpltG8ztlJ
— Kazu (@sakatakazuyukii) 2023年1月13日
SQLを基礎としながらデータ分析で食べていくhttps://t.co/TD4D4gh7pM
— Kazu (@sakatakazuyukii) 2023年1月13日
今は流行ってきたデータサイエンティトhttps://t.co/ZYG8inSR5A
— Kazu (@sakatakazuyukii) 2023年1月13日
河本薫先生の新書。https://t.co/ji6NriKesW
— Kazu (@sakatakazuyukii) 2023年1月13日
最初はブルーバックスの入門書から。https://t.co/BkpTVKppYZ
— Kazu (@sakatakazuyukii) 2023年1月13日
データ・ドリブン社会の創発と戦略 (安宅 和人)
2019年度秋学期 木曜日2時限
科目コード: X1038 / 2単位
カテゴリ: 11.特設科目(学部)
1. 主題と目標/授業の手法など
■ 本講義の特徴
1. 長年、多様なデータを用いたさまざまな分析に関わってきた立場から、実際の仕事や研究に役立つ分析力とは何かを実戦的に伝承する
2. 情報科学技術以前の本質的なサイエンス、分析、問題解決の考
え方に極力フォーカスする
3. 知っているだけではなく分かる、分かるだけでなく出来るに注
力する、、、アタマだけで知っていることを認めない
4. 一方通行ではなく、できる限りインタラクティブに実施する
5. ログデータと市場リサーチデータの両方を扱う
6. 普通には外に出ることがないヤフーのデータを利活用する
(注)ツール系のスキルを教える講座ではありません。
必要ツールがある程度使えることを前提に講義を進めます。
どのようなツールを使うかは各自学生に任せます最低限のツールスキル(Excel、SQL)は補講で対応します。必要なひとは自発的な参加。
参加しない場合はできると見なします(資料・ビデオは履修者限定で展開しますのでコンフリクトがある場合、そちらを参照)ただ純粋にツールスキルを身に着けたい方は本講座ではなく別の講座を履修して下さい
■ 補講について
解析ツールなどのスキルは補講授業で対応する(必要な人は自発的に参加すること。参加しない場合はできると見なします)。
講義は、情報科学技術以前の本質的な分析、問題解決の考え方に極力フォーカスする。
■ 想定受講者
- 情報科学オタクというより、本当に世の中で分析、データ利活用で変化を起こしたい方(本講座でハイエンドの機械学習、自然言語処理問題などは扱いません)
- この世界でデータや分析はどのように世の中に役に立っているのかを理解し、その基本的なスキルを身につけたいと思っている方
- 課題解決、意思決定と分析の関係について肌で感じ、学びたいと思っている方
- これまで色々分析に取り組んでみたが、価値を生み出すポイントが良くわからない方
2. 教材・参考文献
■ 参考文献
「統計でウソをつく法―数式を使わない統計学入門」 (ブルーバックス)
「データサイエンス講義」(オライリー・ジャパン)
“Data Science for Business” (O’Reilly)
「イシューからはじめよ」(英治出版)
「会社を変える分析の力」河本薫著(講談社現代新書)
「シグナル&ノイズ - 天才データアナリストの「予測学」」ネイト・シルバー著(日経BP)
「トップデータサイエンティストが教えるデータ活用実践教室」(日経BP)
「10年戦えるデータ分析入門」青木峰郎著(SB Creative)
「Statistics Hacks - 統計の基本と世界を測るテクニック」Bruce Frey著 (O’Reily ジャパン)
「統計学入門」(東京大学出版会)
「人文・社会科学の統計学」(東京大学出版会)
「自然科学の統計学」(東京大学出版会)
※ 必ずしも適切な教材が見当たらないため、授業の進捗にそって適宜紹介する。
3. 授業計画
第1回 時代背景と本講座の位置づけ
- データドリブンな課題解決領域の広がり
- ドメイン知識の重要性
- 3つのデータ
- データとデータ解析
- 歴史的な局面
- 求められる人物
- Professional とは何か?
第2回 分析の本質とデータ利活用の広がり
- 分析の基本
- 分析の3つの目的
- 意味合い出しのポイント
- ダメな分析のパタン
- データ表現の基本
- 統計数理の5つの役割
- データの広がりとデータごとによる特徴
第3回 データから価値を生み出すとは何か?
- 調査データとビッグデータのサイクル
- 聞いたことがある、わかっている、できるの違い
- データ利活用の 3 要素、、、収集、処理、活用
- データを使う目的
- 事業でのデータ利用の3用途
- マーケティングとは何か
- マーケティング的な事業の見方と課題
第4回 調査データ1:データを読む
- いけてない分析の見極め方
- データを読むポイント
- 相関と因果
- 相関があっても因果関係のない典型的パターン
- 可視化のプロセス
- 答えを出す手順
★(補講1)Excel1:Excel の基本
第5回 調査データ 2:データの性質を知る
- データを眺める(性質を理解する)
- 比較して意味合いを出す
- どのぐらい外れると意味のある異常値なのか?
- 軸選び
- クラスタリングとセグメンテーション
- 分析結果から試算する、、、推計のロジック
第6回 データをチャート化する
- チャート化の 2 つの目的
- チャートの基本構造
- 15 秒ルール
- 縦と横の広がり
- 標準化と重み付け
★ (補講2)Excel2:分析の基本
- 分析ツール
- 基礎的な統計解析: 和、平均、分散、相関
- 相関係数 R と決定係数 R2
- クロス分析(ピボットテーブル)
- 散布図からカーブフィットする
第7回 データをチャート化する2
同上
第8回 行動ログデータ 1
- リアル空間のデータ化
- コンテキスト・アウェア・ コンピューティング(Context
- Aware Computing)
- スマホに内蔵されているセンサ
- 行動ログに隠された情報
- 活動量計データと同行検知
第9回 行動ログデータ2
- データを眺め、仮説をたてる
- グラフ的な関係を見る
- 大量の単純処理を回す工夫
- プログラムの役割
- センサデータ解析のための前処理
- データ成型、データ変換、ノイズ除去
第10回 調査データ3:ニーズを掴む1
- 基本となるマインドセット
- ニーズとベネフィット
- ニーズの 4 レイヤ
- ブランドダイアモンド
- 本音と建前
- ブレイクポイント
第11回 調査データ 4:ニーズを掴む2
- 消費者マーケティングにおけるリサーチ手法の広がり
- 軸出しに関する考察
- MECE に考える技
第12回 クエリログデータ 1:罹患を予測する
- クエリデータとはなにか
- データ分析と可視化の関係
- データ利用基盤の三層構造
- 情報利活用に必要なプロフェッショナルの広がり
- イシュー見極めのポイント
- モデル化と予測
- シグナルとノイズ
- 実数と指数
★(補講3)SQL の基礎1
第13回 クエリログデータ 2:選挙予測
- 縦軸と横軸:変数とアウトプット
- データ類似性の判別
- ドメイン知識の重要性
- モデル化と予測2
★(補講3)SQL の基礎1
第14回 データとAI がもたらす未来
- 平均は事実を必ずしも表さない
- AI に関する誤解と正しい理解
- ビッグデータと AI の関係
- 機械学習による AI がもたらす変化
- シゴトの未来
- 人工知能の不都合な真実
- AI×データはビジネスをどう変えるか
- データ・キカイ時代の新しいヒエラルキー