タイトル

開講年度 開講学部等
2025 理学部
開講学期 曜日時限 授業形態 AL(アクティブ・ラーニング)ポイント
後期 月7~8 実験・実習 7.0
時間割番号 科目名[英文名] 使用言語 単位数
1042220035 データサイエンス実践[Applied Date Science Practice] 日本語 2
担当教員(責任)[ローマ字表記] メディア授業
川村 正樹[KAWAMURA Masaki]
担当教員[ローマ字表記]
川村 正樹 [KAWAMURA Masaki], GERDPRASERT THANAWIT [GERDPRASERT Thanawit], 王 元元 [OH Gengen]
特定科目区分   対象学生   対象年次 3~
ディプロマ・ポリシーに関わる項目 カリキュラムマップ(授業科目とDPとの対応関係はこちらから閲覧できます)
授業の目的と概要
この授業では、データ分析手法とツールを利用して、ビジネスやシステムの改善などに対する価値を創造するための手法を実践する。 主な内容は、データアクセスの基礎、データクレンジング、データ加工、分析モデル及びそのテストや検証、データの可視化と洞察に基づいてインサイトレポートを作成し、ビジネスへの改善を提案することである。

本授業は、理学部と工学部が共同で開講している。
実施内容(全15回):
・数理計画問題に関するプログラミングを行う。(5回)
・データ分析ツールを用いて、データ分析の座学と体験を行う。(5回)
・実世界のビッグデータを用いて、PBL型の演習と実践を行う。(5回)
授業の到達目標
・数理計画問題に関するプログラミングを行えるようになる。
・データを処理するアルゴリズムによって、計算時間に差があること、及び、結果に差があることを理解する。
・実世界の課題に対して問題解決能力を身に付ける。
・実世界のビッグデータを取り扱うことができる。
・課題を解決するためにデータ分析モデルの作成や活用ができる。
・生データから価値を創造し、そのデータに基づいてビジネスまたはシステムの改善が提案できる。
授業計画
【全体】
第1回から第5回は、理学部の教員が担当し座学や演習を行う。
第6回から第10回は、工学部の教員が担当し座学や演習を行う。
第11回から第15回は、工学部の教員が担当し応用的プロジェクトを行う。
項目 内容 授業時間外学習 備考
第1回 TSPの解法1:最近近傍法 組合せを最適化問題の1つであるTSPを理解し、ヒューリスティックスの一例である最近近傍法のプログラムを作成する。 最近近傍法のプログラムを完成させる(4時間)。
第2回 TSPの解法2:2-opt法 2-opt法のプログラムを作成する。 2-opt法のプログラムを完成させる(4時間)。
第3回 TSPの解法3:各自で選択した手法 厳密解法またはメタヒューリスティックスの方法を1つ選び、そのプログラムを作成する。 実装するアルゴリズムの整理(4時間)
第4回 TSPの解法3:各自で選択した手法 厳密解法またはメタヒューリスティックスの方法を1つ選び、そのプログラムを作成する。 未完成な関数の作成(4時間)
第5回 コンテストの実施 評価データに対して、最適解に近い順に順位を付ける。 コンテストの結果を整理し、結果を考察する。レポートとしてまとめる(4時間)。
第6回 座学、体験 データ分析考え方、ツールとプロセスについて紹介する。ツールを用いて全体的なデータ処理のプロセスの設計について説明する。 配布資料を参照し授業内容の復習2時間と課題の取り組みに2時間を行う。
第7回 座学、体験 実世界のビッグデータ(1万件程度)を入手し、理解した上でそのデータに対する課題に向けて分析アプローチを体験し、深く理解する。 配布資料を参照し授業内容の復習2時間と課題の取り組みに2時間を行う。
第8回 座学、体験 PDCAで作成した分析モデルを取り扱い、評価しながら課題の解決に向けてデータ処理プロセスを繰り返す体験を通じて、理解する。 配布資料を参照し授業内容の復習2時間を行い、課題の取り組みに2時間を行う。
第9回 座学、体験 分析結果を評価し、洞察を作成する。また、レポートに基づき課題の解決やビジネスの改善を提案することを体験し、理解する。 配布資料を参照し授業内容の復習2時間を行い、課題の取り組みに2時間を行う。
第10回 座学、体験 第7回~第9回で得られた知識を活かして、異なるデータセットで一通り分析手順を再現し、体験する。 配布資料を参照し授業内容の復習2時間を行い、課題の取り組みに2時間を行う。
第11回 演習、プロジェクト推進 応用的プロジェクト(課題設定、仮説を立てる、データを選択する) 自習的にプロジェクトに取り組む(4時間)。 グループワークを実施する。
第12回 演習、プロジェクト推進 応用的プロジェクト(分析プロセスの設計及び改善) 自習的にプロジェクトに取り組む(4時間)。 グループワークを実施する。
第13回 演習、プロジェクト推進 応用的プロジェクト(分析結果の確認及び評価) 自習的にプロジェクトに取り組む(4時間)。 グループワークを実施する。
第14回 演習、プロジェクト推進 応用的プロジェクト(洞察レポートの作成・提案作成) 自習的にプロジェクトに取り組む(4時間)。 グループワークを実施する。
第15回 演習、プロジェクト推進 応用的プロジェクト(発表・評価) 自習的にプロジェクトに取り組む(4時間)。 グループワークを実施する。
※AL(アクティブ・ラーニング)欄に関する注
・授業全体で、AL(アクティブ・ラーニング)が占める時間の割合を、それぞれの項目ごとに示しています。
・A〜Dのアルファベットは、以下の学修形態を指しています。
【A:グループワーク】、【B:ディスカッション・ディベート】、【C:フィールドワーク(実験・実習、演習を含む)】、【D:プレゼンテーション】
A: 30% B: 15% C: 20% D: 5%
成績評価法
欠席は3回までとし、4回以上欠席した場合は欠格とする。教育実習など特別な事情がある場合は、事前に申し出た場合に限り、考慮することがある。
成績は小テスト10%、授業外レポート(11回)70%、発表20%の成績で総合的に評価する。
小テスト(10点)、授業外レポート(70点)、発表(20点)、総合得点が60点以上で合格とする。
また、成績評価にかかるレポートであるので、他人のレポート、プログラムやグラフ(データ)等を写したものは不正行為として扱う。
いくらプログラム技術が優れていても、それをレポート等で説明できなければ評価されないので、しっかりと記述すること。
教科書にかかわる情報
備考
講義中に指示する。また本講義ではMoodleを活用する。
参考書にかかわる情報
備考
好きなC言語に関する本を持参してよい。
メッセージ
・データサイエンスの基礎知識が必要です。
・プログラミングの経験を必要とします。
・成績・評価に関する問い合わせはメールでは回答できません。
・分からないことは、教員に質問する習慣を付けましょう。
キーワード
データサイエンス
分析プロジェクト
最適化問題
C言語プログラム
持続可能な開発目標(SDGs)

  • 産業と技術革新の基盤をつくろう
  • 住み続けられるまちづくりを
(インフラ、産業化、イノベーション)強靱(レジリエント)なインフラ構築、包摂的かつ持続可能な産業化の促進及びイノベーションの推進を図る。
(持続可能な都市)包摂的で安全かつ強靱(レジリエント)で持続可能な都市及び人間居住を実現する。
関連科目
(理学部)プログラミング言語I, II、プログラミング演習I, II、最適化理論
(工学部)データサイエンス技術、データサイエンス技術演習
履修条件
・データサイエンスの基礎知識が必要です。
・プログラミングの経験を必要とします。
連絡先
理学部:
川村 kawamura[at]sci.yamaguchi-u.ac.jp
研究室 吉田キャンパス 総合研究棟408号室(東側)

工学部:
王 y.wang[at]yamaguchi-u.ac.jp
タナヴィット thanawit-g[at]yamaguchi-u.ac.jp
研究室 常盤キャンパス 総合研究棟2号館 210号室(王)、知能情報棟 609号室(タナヴィット)

※[at]の部分を@に書き換えてメールしてください。
オフィスアワー
理学部(川村):11:00 〜 14:00
工学部(王、タナヴィット):在室時の対応が可能であるが、あらかじめメールで連絡することが望ましい。

ページの先頭へ