タイトル

開講年度 開講学部等
2025 大学院創成科学研究科(博士前期)
開講学期 曜日時限 授業形態 AL(アクティブ・ラーニング)ポイント
後期後半 水1~2 講義  
時間割番号 科目名[英文名] 使用言語 単位数
3262420540 大規模データ解析特論[Big Data Analytics] 日本語 1
担当教員(責任)[ローマ字表記] メディア授業
中村 秀明[NAKAMURA Hideaki]
担当教員[ローマ字表記]
中村 秀明 [NAKAMURA Hideaki], 間普 真吾 [MABU Shingo]
特定科目区分   対象学生   対象年次  
ディプロマ・ポリシーに関わる項目 カリキュラムマップ(授業科目とDPとの対応関係はこちらから閲覧できます)
授業の目的と概要
ものづくりやビジネスの現場では,データをもとに,統計的な思考力によって様々な課題を解決していく能力,すなわち“データサイエンス”力の高い人材が求められている.この講義は,“データサイエンス”力の向上を目指し,事例なども踏まえ,大規模データ解析の基本的な知識を学ぶ.
授業の到達目標
・ビックデータの概要と活用について理解する.
・並列分散処理基盤について理解する.
・統計的手法を使い,基本的なデータ解析が行える.
・並列分散処理基盤が構築できる.
・並列分散処理による大規模データ解析が行える.
・大規模データ解析の結果について,説明できる.
授業計画
【全体】
講義は前半ではビッグデータの概要とデータ分析の基本となる統計解析手法について学び,後半では実際に手を動かして実習を行う.
講義で使う資料は,事前にダウンロードできるようにし,必要に応じてプリントを配布する.
項目 内容 授業時間外学習 備考
第1回 オリエンテーション
・ビッグデータ活用・解析の事例
・統計解析の基礎
ビッグデータ解析の必要性とビッグデータの活用や解析事例を紹介するとともに,統計解析の基礎について学ぶ Moodleに掲載してある事前配布資料を読んでおくこと。
復習のためのオンデマンド教材を用意してあるので、理解できなかった箇所は、オンデマンド教材で確認すること。
予習・復習(学修時間の目安:4時間以上)
第2回 多変量解析 重回帰分析,主成分分析,判別分析,クラスター分析など大規模データ解析に必要な統計手法について学ぶ Moodleに掲載してある事前配布資料を読んでおくこと。
復習のためのオンデマンド教材を用意してあるので、理解できなかった箇所は、オンデマンド教材で確認すること。
予習・復習(学修時間の目安:4時間以上)
第3回 データマイニングと機械学習(その1) 大規模データ解析に必要なデータマイニングや機械学習の手法について学ぶ Moodleに掲載してある事前配布資料を読んでおくこと。
復習のためのオンデマンド教材を用意してあるので、理解できなかった箇所は、オンデマンド教材で確認すること。
予習・復習(学修時間の目安:4時間以上)
第4回 データマイニングと機械学習(その2) 機械学習の演習 Moodleに掲載してある事前配布資料を読んでおくこと。
復習のためのオンデマンド教材を用意してあるので、理解できなかった箇所は、オンデマンド教材で確認すること。
予習・復習(学修時間の目安:4時間以上)
第5回 分散並列処理機基盤の概要 ビッグデータ解析で必要となる分散並列処理基盤であるHadoopについて,その概要を説明する.
MapReduceやSparkについて、その概要を説明する.
Moodleに掲載してある事前配布資料を読んでおくこと。
復習のためのオンデマンド教材を用意してあるので、理解できなかった箇所は、オンデマンド教材で確認すること。
予習・復習(学修時間の目安:4時間以上)
第6回 相関ルールによるデータ解析(その1) (オンデマンド)
アプリオリ法を中心としたデータマイニング(相関ルール抽出法)について学ぶ.
オンデマンドで講義を行うので、Moodleの資料等を確認すること。
予習・復習(学修時間の目安:4時間以上)
第7回 相関ルールによるデータ解析(その2) (オンデマンド)
実データに対するデータマイニングを行い,その結果を分析する.
オンデマンドで講義を行うので、Moodleの資料等を確認すること。
予習・復習(学修時間の目安:4時間以上)
第8回 まとめ (オンデマンド)
授業の総括を行う.
具体的な事例についてオンデマンドで説明する。
予習・復習(学修時間の目安:4時間以上)
※AL(アクティブ・ラーニング)欄に関する注
・授業全体で、AL(アクティブ・ラーニング)が占める時間の割合を、それぞれの項目ごとに示しています。
・A〜Dのアルファベットは、以下の学修形態を指しています。
【A:グループワーク】、【B:ディスカッション・ディベート】、【C:フィールドワーク(実験・実習、演習を含む)】、【D:プレゼンテーション】
A: --% B: --% C: --% D: --%
成績評価法
レポート(複数回) 100%
出席は欠格条件とし,3回以上の欠席で欠格とします. 
教科書にかかわる情報
備考
教科書は特に使用しません。
Moodleから資料をダウンロードできるようにします。
参考書にかかわる情報
参考書 書名 Hadoop ISBN 9784873116297
著者名 Tom White 出版社 オイラリー・ジャパン 出版年 2013
参考書 書名 Hadoop徹底入門 ISBN 9784798129648
著者名 太田一樹他 出版社 翔泳社 出版年 2013
備考
メッセージ
キーワード
実務家教員
ビッグデータ、分散並列処理、データマイニング、機械学習
持続可能な開発目標(SDGs)

  • 産業と技術革新の基盤をつくろう
(インフラ、産業化、イノベーション)強靱(レジリエント)なインフラ構築、包摂的かつ持続可能な産業化の促進及びイノベーションの推進を図る。
関連科目
履修条件
連絡先
中村秀明
nakahide@yamaguchi-u.ac.jp
0836-85-9531
間普真吾
mabu@yamaguchi-u.ac.jp
0836-85-9519
オフィスアワー
質問等は、メールにより随時受け付けます。

ページの先頭へ