開講年度
開講学部等
2025
工学部
開講学期
曜日時限
授業形態
AL(アクティブ・ラーニング)ポイント
前期
金9~10
時間割番号
科目名[英文名]
使用言語
単位数
1061139000
データサイエンス技術[Data Science Technology]
日本語
2
担当教員(責任)[ローマ字表記]
メディア授業
藤井 文武[FUJII Fumitake]
○
担当教員[ローマ字表記]
藤井 文武 [FUJII Fumitake]
特定科目区分
対象学生
機械
対象年次
3~
ディプロマ・ポリシーに関わる項目
カリキュラムマップ(授業科目とDPとの対応関係はこちらから閲覧できます)
メディア授業
×
メディア授業とは,メディアを利用して遠隔方式により実施する授業の授業時数が,総授業時数の半数を超える授業をいいます。
メディア授業により取得した単位は,卒業要件として修得すべき単位のうち60単位を超えないものとされています。
授業の目的と概要
多種多様かつ大量のデータを適切に処理し,データ間の関連性の検討,データが持つ意味の抽出,データに基づく推論・判断などを行う上で必要な基礎知識と,各種技法について説明する.特に,各種技法の問題定式化の説明と,背景の数理に重きを置いて説明する.また,時間が許す範囲において python の適切なライブラリを利用したデータ処理の実践方法を説明する.
データサイエンスの基本的概念およびデータ分析の基礎的な技術を身につける.
授業の到達目標
知識・理解の観点:データ処理・分析に関連する基本的な概念を理解する.
思考・判断の観点:適切なデータ処理・分析により,生データを見るだけでは明確でなかったデータの意味・特徴が把握出来たり,より高次の判 断が可能となることを理解する.
関心・意欲の観点:実社会のデータに興味を持ち,その活用について考える. 態度の観点 演習によって,講義で学んだ内容を実践できるようにする.
技能・表現の観点:Python の適切なライブラリを活用して,目的に応じたデータ処理・検定等が行えるようになる.
授業計画
【全体】
データサイエンスの基本的概念について学ぶ.
特に,データ分析とデータの可視化について重点的に行う.
演習の時間を設けて講義の理解を図る.
項目
内容
授業時間外学習
備考
第1回
データサイエンス,統計数理基礎1
データの記述
CとPythonの比較(特徴の説明)
演習環境の説明(Jupyter Notebook / Jupyter-hubの使い方)
復習を行う.Jupyter Notebook の操作を練習すること(学修時間の目安:4時間)
第2回
統計数理基礎2
データ集合の性質を表す基本統計量,確率,条件付き確率とベイズの定理について説明する.
授業時間内に完了できなかった演習課題に取り組むこと(学修時間の目安:4時間)
第3回
統計数理基礎3,統計的推測・統計的検定1
主要な確率分布,相関係数,分割表および項目の独立性検証の考え方を説明する.
授業時間内に完了できなかった演習課題に取り組むこと(学修時間の目安:4時間)
第4回
統計的推測・統計的検定2
点推定,区間推定及び統計的仮説検定について説明する.
授業時間内に完了できなかった演習課題に取り組むこと(学修時間の目安:4時間)
第5回
データ分析と可視化1
さまざまなグラフの種類と,官公庁により公開されている統計データについて説明する.
授業時間内に完了できなかった演習課題に取り組むこと(学修時間の目安:4時間)
第6回
データ分析と可視化2
データの前処理,標準化,正規化と欠損値,外れ値の取り扱いについて学ぶ.
授業時間内に完了できなかった演習課題に取り組むこと(学修時間の目安:4時間)
第7回
データ分析と可視化3
データ処理のプロセスと時系列データの取り扱い・分析法について学ぶ.
授業時間内に完了できなかった演習課題に取り組むこと(学修時間の目安:4時間)
第8回
データ分析と可視化4
データの集計,クロス集計表,度数について学ぶ.
授業時間内に完了できなかった演習課題に取り組むこと(学修時間の目安:4時間)
第9回
クラスタリング1
分類とクラスタリングの違い,データの類似性を表す指標として用いられる距離や類似度について学ぶ.
授業時間内に完了できなかった演習課題に取り組むこと(学修時間の目安:4時間)
第10回
クラスタリング2
デンドログラムとk-means法を中心に,階層クラスタリング/非階層クラスタリングについて学ぶ.
授業時間内に完了できなかった演習課題に取り組むこと(学修時間の目安:4時間)
第11回
機械学習1
人工知能・機械学習・SVM・決定木などについて学ぶ.
授業時間内に完了できなかった演習課題に取り組むこと(学修時間の目安:4時間)
第12回
機械学習2
モデル性能の評価法,分類モデルの性能評価(混同行列,評価指標,ROC曲線)と,ニューラルネットワークの基礎について学ぶ.
授業時間内に完了できなかった演習課題に取り組むこと(学修時間の目安:4時間)
第13回
回帰分析,判別分析
回帰分析,判別分析の定式化と背景の数理・仮定の意味について学ぶ.
授業時間内に完了できなかった演習課題に取り組むこと(学修時間の目安:4時間)
第14回
主成分分析と因子分析
主成分分析と重回帰分析の関係性,因子分析との意味の違いについて説明する.
授業時間内に完了できなかった演習課題に取り組むこと(学修時間の目安:4時間)
第15回
期末試験
習ったこと全般に対して期末試験を行う.
授業で指示された重要なポイントについて十分に復習を行ったうえで試験に臨むこと.
※AL(アクティブ・ラーニング)欄に関する注
・授業全体で、AL(アクティブ・ラーニング)が占める時間の割合を、それぞれの項目ごとに示しています。
・A〜Dのアルファベットは、以下の学修形態を指しています。
【A:グループワーク】、【B:ディスカッション・ディベート】、【C:フィールドワーク(実験・実習、演習を含む)】、【D:プレゼンテーション】
A: --% B: --% C: --% D: --%
成績評価法
学期末の筆記テスト 80%
宿題 20%
教科書にかかわる情報
教科書
書名
データサイエンス技術
ISBN
9784780609592
著者名
相田紗織
出版社
学術図書出版社
出版年
2021
備考
参考書にかかわる情報
参考書
書名
東京大学のデータサイエンティスト育成講座 : Pythonで手を動かして学ぶデータ分析
ISBN
9784839965259
著者名
塚本邦尊, 山田典一, 大澤文孝著
出版社
マイナビ出版
出版年
2019
備考
メッセージ
講義では,パソコンを使った演習を行うので,ノートパソコンが必要なので持参すること.
キーワード
データサイエンス,データ分析,可視化,統計,確率,検定,人工知能,機械学習,回帰,分類,クラスタリング,Python
持続可能な開発目標(SDGs)
(インフラ、産業化、イノベーション)強靱(レジリエント)なインフラ構築、包摂的かつ持続可能な産業化の促進及びイノベーションの推進を図る。
関連科目
プログラミング基礎,確率統計,卒業論文.
履修条件
連絡先
ffujii[at]yamaguchi-u.ac.jp
※ メールアドレスは [at] を半角の@に置き換えてください。
オフィスアワー
まずはメールにて問い合わせてください.
ページの先頭へ