タイトル

開講年度 開講学部等
2026 大学院技術経営研究科
開講学期 曜日時限 授業形態 AL(アクティブ・ラーニング)ポイント
前期集中 集中 講義 10.0
時間割番号 科目名[英文名] 使用言語 単位数
8061000012 データサイエンスMOT特論[Data Science MOT] 日本語 2
担当教員(責任)[ローマ字表記] メディア授業
髙橋 雅和[TAKAHASHI Masakazu]
担当教員[ローマ字表記]
髙橋 雅和 [TAKAHASHI Masakazu]
特定科目区分   対象学生   対象年次  
ディプロマ・ポリシーに関わる項目 カリキュラムマップ(授業科目とDPとの対応関係はこちらから閲覧できます)
授業の目的と概要
本特論では,データサイエンスに必要となる基本的な概念や技法に焦点をあてる.データサイエンス自体は,様々な分野での知識抽出手法として採用されてきた.本特論では,データの収集,分類,分析,モデル化,予測という一連のデータサイエンスのプロセスを実習形式で行う.
授業の到達目標
データサイエンスの実務適用を目指し,データサイエンスの基本概念と基礎理論を習得する。
授業計画
【全体】
学習ステップは以下のとおり.
まず,主要な概念を理解する.次にデータサイエンスの各プロセスを学習する.最後に、解析手法を学習する.なお,履修者の習得状況に応じて適宜講義の進行は前後させる.
項目 内容 授業時間外学習 備考
第1回 探索的データ分析1 1 構造化データの諸要素
2 矩形データ
3 位置の推定
4 散らばりの推定
予習と復習(目安:4時間)
第2回 探索的データ分析2 5 データ分布の探索
6 バイナリデータとカテゴリデータの探索
7 相関
8 2つ以上の変量の探索
予習と復習(目安:4時間)
第3回 データと標本の分布1 1 無作為抽出と標本バイアス
2 選択バイアス
3 統計量の標本分布
4 ブートストラップ
5 信頼区間
予習と復習(目安:4時間)
第4回 データと標本の分布2 6 正規分布
7 ロングテールの分布
8 スチューデントのt分布
9 二項分布
10 ポアソン分布と関連する分布
予習と復習(目安:4時間)
第5回 統計実験と有意性検定1 1 A/Bテスト
2 仮説検定
3 リサンプリング
4 統計的有意性とp値
5 t検定
予習と復習(目安:4時間)
第6回 統計実験と有意性検定2 6 多重検定
7 自由度
8 ANOVA
9 カイ二乗検定
10 多腕バンディットアルゴリズム
11 検定力とサンプルサイズ
予習と復習(目安:4時間)
第7回 回帰と予測1 1 単回帰
2 重回帰
3 回帰を使った予測
4 回帰でのファクタ変数
予習と復習(目安:4時間)
第8回 回帰と予測2 5 回帰式の解釈
6 仮定をテストする:回帰診断
7 多項式回帰およびスプライン回帰
予習と復習(目安:4時間)
第9回 分類1 1 ナイーブベイズ
2 判別分析
3 ロジスティック回帰
予習と復習(目安:4時間)
第10回 分類2 4 分類モデルの評価
5 不均衡データの戦略
予習と復習(目安:4時間)
第11回 統計的機械学習1 1 k近傍法
2 木モデル
予習と復習(目安:4時間)
第12回 統計的機械学習2 3 バギングとランダムフォレスト
4 ブースティング
予習と復習(目安:4時間)
第13回 教師なし学習1 1 主成分分析
2 k平均クラスタリング
3 階層クラスタリング
予習と復習(目安:4時間)
第14回 教師なし学習2 4 モデルベースクラスタリング
5 スケーリングとカテゴリ変数
予習と復習(目安:4時間)
第15回 まとめ 講義総括 予習と復習(目安:4時間)
※AL(アクティブ・ラーニング)欄に関する注
・授業全体で、AL(アクティブ・ラーニング)が占める時間の割合を、それぞれの項目ごとに示しています。
・A〜Dのアルファベットは、以下の学修形態を指しています。
【A:グループワーク】、【B:ディスカッション・ディベート】、【C:フィールドワーク(実験・実習、演習を含む)】、【D:プレゼンテーション】
A: 10% B: 20% C: 10% D: 60%
成績評価法
小テスト・授業内レポート10%
宿題・授業外レポート30%
授業態度・授業への参加度30%
受講者の発表(プレゼン)・授業内での制作作品30%
教科書にかかわる情報
教科書 書名 Rではじめるデータサイエンス ISBN 4814400772
著者名 Hadley Wickham, Mine Cetinkaya‐Rundel, Garrett Grolemund著 ; 大橋 出版社 オライリー・ジャパン 出版年 2024
教科書 書名 データサイエンスのための統計学入門 : 予測、分類、統計モデリング、統計的機械学習とR/Pythonプログラミング ISBN 487311926X
著者名 Peter Bruce, Andrew Bruce, Peter Gedeck著 ; 黒川利明訳 出版社 オライリー・ジャパン 出版年 2020
教科書 書名 データサイエンスのための数学入門 : Pythonで学ぶ線形代数、確率、統計の基礎 ISBN 4814401264
著者名 Thomas Nield著 ; 江川崇訳 出版社 オライリー・ジャパン 出版年 2025
教科書 書名 Pythonデータサイエンスハンドブック : Jupyter、NumPy、pandas、Matplotlib、scikit-learnを使ったデータ分析、機械学習 ISBN 4814400632
著者名 Jake VanderPlas著 ; 菊池彰訳 出版社 オライリー・ジャパン 出版年 2024
教科書 書名 統計的学習の基礎 : データマイニング・推論・予測 ISBN 432012362X
著者名 Trevor Hastie, Robert Tibshirani, Jerome Friedman著 ; 井尻善久 [ほか] 出版社 共立出版 出版年 2014
備考
教科書や参考文献は適宜講義で指示する.
参考書にかかわる情報
参考書 書名 データサイエンス設計マニュアル ISBN 4873118913
著者名 Steven S. Skiena 著・文・その他,小野 陽子 監修,長尾 高弘 翻訳,Steven S. Skiena,小野 出版社 オライリー・ジャパン 出版年 2020
参考書 書名 統計的因果推論 : 入門 ISBN 4254122411
著者名 Judea Pearl, Madelyn Glymour, Nicholas P. Jewell [著] ; 落海浩訳 出版社 朝倉書店 出版年 2019
参考書 書名 情報系のための離散数学 : discrete mathematics for computer science ISBN 4320114361
著者名 猪股俊光, 南野謙一著 出版社 共立出版 出版年 2020
参考書 書名 多モデル思考 : データを知恵に変える24の数理モデル ISBN 9784627855014
著者名 スコット・E.ペイジ著 ; 長尾高弘訳 出版社 森北出版 出版年 2020
参考書 書名 データ・ドリブン・マーケティング : 最低限知っておくべき15の指標 ISBN 4478039631
著者名 マーク・ジェフリー著 ; 佐藤純, 矢倉純之介, 内田彩香共訳 出版社 ダイヤモンド社 出版年 2017
備考
参考文献は適宜講義で指示する.
メッセージ
実習が含まれます.履修者は,PCを持参のこと.
キーワード
データサイエンス,統計学,機械学習,オープンソース,知識表現,可視化,意思決定.
実務家教員
持続可能な開発目標(SDGs)

  • 働きがいも経済成長も
  • 産業と技術革新の基盤をつくろう
  • 人や国の不平等をなくそう
  • 住み続けられるまちづくりを
  • つくる責任つかう責任
(経済成長と雇用)包摂的かつ持続可能な経済成長及びすべての人々の完全かつ生産的な雇用と働きがいのある人間らしい雇用(ディーセント・ワーク)を促進する。
(インフラ、産業化、イノベーション)強靱(レジリエント)なインフラ構築、包摂的かつ持続可能な産業化の促進及びイノベーションの推進を図る。
(不平等)各国内及び各国間の不平等を是正する。
(持続可能な都市)包摂的で安全かつ強靱(レジリエント)で持続可能な都市及び人間居住を実現する。
(持続可能な生産と消費)持続可能な生産消費形態を確保する。
関連科目
履修条件
連絡先
公式メールアドレス宛に連絡をお願いします.e-mail: masakazu *[at]* yamaguchi-u.ac.jp
オフィスアワー
固定的な時間帯は特に設定しません.質疑のある場合は,適宜上記アドレスまで連絡下さい.

ページの先頭へ