開講年度
開講学部等
2025
大学院技術経営研究科
開講学期
曜日時限
授業形態
AL(アクティブ・ラーニング)ポイント
前期集中
集中
講義
10.0
時間割番号
科目名[英文名]
使用言語
単位数
8061000012
データサイエンスMOT特論[Data Science MOT]
日本語
2
担当教員(責任)[ローマ字表記]
メディア授業
髙橋 雅和[TAKAHASHI Masakazu]
ー
担当教員[ローマ字表記]
髙橋 雅和 [TAKAHASHI Masakazu]
特定科目区分
対象学生
対象年次
ディプロマ・ポリシーに関わる項目
カリキュラムマップ(授業科目とDPとの対応関係はこちらから閲覧できます)
メディア授業
×
メディア授業とは,メディアを利用して遠隔方式により実施する授業の授業時数が,総授業時数の半数を超える授業をいいます。
メディア授業により取得した単位は,卒業要件として修得すべき単位のうち60単位を超えないものとされています。
授業の目的と概要
本特論では,データサイエンスに必要となる基本的な概念や技法に焦点をあてる.データサイエンス自体は,様々な分野での知識抽出手法として採用されてきた.本特論では,データの収集,分類,分析,モデル化,予測という一連のデータサイエンスのプロセスを実習形式で行う.
授業の到達目標
データサイエンスの実務適用を目指し,データサイエンスの基本概念と基礎理論を習得する。
授業計画
【全体】
学習ステップは以下のとおり.
まず,主要な概念を理解する.次にデータサイエンスの各プロセスを学習する.最後に、解析手法を学習する.なお,履修者の習得状況に応じて適宜講義の進行は前後させる.
項目
内容
授業時間外学習
備考
第1回
探索的データ分析1
1 構造化データの諸要素
2 矩形データ
3 位置の推定
4 散らばりの推定
予習と復習(目安:4時間)
第2回
探索的データ分析2
5 データ分布の探索
6 バイナリデータとカテゴリデータの探索
7 相関
8 2つ以上の変量の探索
予習と復習(目安:4時間)
第3回
データと標本の分布1
1 無作為抽出と標本バイアス
2 選択バイアス
3 統計量の標本分布
4 ブートストラップ
5 信頼区間
予習と復習(目安:4時間)
第4回
データと標本の分布2
6 正規分布
7 ロングテールの分布
8 スチューデントのt分布
9 二項分布
10 ポアソン分布と関連する分布
予習と復習(目安:4時間)
第5回
統計実験と有意性検定1
1 A/Bテスト
2 仮説検定
3 リサンプリング
4 統計的有意性とp値
5 t検定
予習と復習(目安:4時間)
第6回
統計実験と有意性検定2
6 多重検定
7 自由度
8 ANOVA
9 カイ二乗検定
10 多腕バンディットアルゴリズム
11 検定力とサンプルサイズ
予習と復習(目安:4時間)
第7回
回帰と予測1
1 単回帰
2 重回帰
3 回帰を使った予測
4 回帰でのファクタ変数
予習と復習(目安:4時間)
第8回
回帰と予測2
5 回帰式の解釈
6 仮定をテストする:回帰診断
7 多項式回帰およびスプライン回帰
予習と復習(目安:4時間)
第9回
分類1
1 ナイーブベイズ
2 判別分析
3 ロジスティック回帰
予習と復習(目安:4時間)
第10回
分類2
4 分類モデルの評価
5 不均衡データの戦略
予習と復習(目安:4時間)
第11回
統計的機械学習1
1 k近傍法
2 木モデル
予習と復習(目安:4時間)
第12回
統計的機械学習2
3 バギングとランダムフォレスト
4 ブースティング
予習と復習(目安:4時間)
第13回
教師なし学習1
1 主成分分析
2 k平均クラスタリング
3 階層クラスタリング
予習と復習(目安:4時間)
第14回
教師なし学習2
4 モデルベースクラスタリング
5 スケーリングとカテゴリ変数
予習と復習(目安:4時間)
第15回
まとめ
講義総括
予習と復習(目安:4時間)
※AL(アクティブ・ラーニング)欄に関する注
・授業全体で、AL(アクティブ・ラーニング)が占める時間の割合を、それぞれの項目ごとに示しています。
・A〜Dのアルファベットは、以下の学修形態を指しています。
【A:グループワーク】、【B:ディスカッション・ディベート】、【C:フィールドワーク(実験・実習、演習を含む)】、【D:プレゼンテーション】
A: 10% B: 20% C: 10% D: 60%
成績評価法
小テスト・授業内レポート10%
宿題・授業外レポート30%
授業態度・授業への参加度30%
受講者の発表(プレゼン)・授業内での制作作品30%
教科書にかかわる情報
教科書
書名
データサイエンスのための統計学入門 ―予測、分類、統計モデリング、統計的機械学習とRプログラミング
ISBN
9784873119267
著者名
Peter Bruce, Andrew Bruce
出版社
オライリージャパン
出版年
2018
備考
教科書や参考文献は適宜講義で指示する.
参考書にかかわる情報
参考書
書名
データサイエンス設計マニュアル
ISBN
4873118913
著者名
Steven S. Skiena 著・文・その他,小野 陽子 監修,長尾 高弘 翻訳,Steven S. Skiena,小野
出版社
オライリー・ジャパン
出版年
2020
参考書
書名
統計的因果推論 : 入門
ISBN
4254122411
著者名
Judea Pearl, Madelyn Glymour, Nicholas P. Jewell [著] ; 落海浩訳
出版社
朝倉書店
出版年
2019
参考書
書名
情報系のための離散数学 : discrete mathematics for computer science
ISBN
4320114361
著者名
猪股俊光, 南野謙一著
出版社
共立出版
出版年
2020
参考書
書名
多モデル思考 : データを知恵に変える24の数理モデル
ISBN
9784627855014
著者名
スコット・E.ペイジ著 ; 長尾高弘訳
出版社
森北出版
出版年
2020
参考書
書名
データ・ドリブン・マーケティング : 最低限知っておくべき15の指標
ISBN
4478039631
著者名
マーク・ジェフリー著 ; 佐藤純, 矢倉純之介, 内田彩香共訳
出版社
ダイヤモンド社
出版年
2017
備考
参考文献は適宜講義で指示する.
メッセージ
実習が含まれます.履修者は,PCを持参のこと.
キーワード
データサイエンス,統計学,機械学習,オープンソース,知識表現,可視化,意思決定.
持続可能な開発目標(SDGs)
(経済成長と雇用)包摂的かつ持続可能な経済成長及びすべての人々の完全かつ生産的な雇用と働きがいのある人間らしい雇用(ディーセント・ワーク)を促進する。
(インフラ、産業化、イノベーション)強靱(レジリエント)なインフラ構築、包摂的かつ持続可能な産業化の促進及びイノベーションの推進を図る。
(不平等)各国内及び各国間の不平等を是正する。
(持続可能な都市)包摂的で安全かつ強靱(レジリエント)で持続可能な都市及び人間居住を実現する。
(持続可能な生産と消費)持続可能な生産消費形態を確保する。
関連科目
履修条件
連絡先
公式メールアドレス宛に連絡をお願いします.e-mail: masakazu *[at]* yamaguchi-u.ac.jp
オフィスアワー
固定的な時間帯は特に設定しません.質疑のある場合は,適宜上記アドレスまで連絡下さい.
ページの先頭へ