タイトル

開講年度 開講学部等
2025 大学院人間社会科学研究科(修士課程)
開講学期 曜日時限 授業形態 AL(アクティブ・ラーニング)ポイント
後期 火3~4   9.0
時間割番号 科目名[英文名] 使用言語 単位数
2112000016 テキストマイニング特論[Advanced Text Mining] 日本語 2
担当教員(責任)[ローマ字表記] メディア授業
岩野 摩耶[IWANO Maya]
担当教員[ローマ字表記]
岩野 摩耶 [IWANO Maya]
特定科目区分   対象学生   対象年次  
ディプロマ・ポリシーに関わる項目 カリキュラムマップ(授業科目とDPとの対応関係はこちらから閲覧できます)
授業の目的と概要
ビッグデータからの情報分析は、情報量が増大している近年において需要が大きくなっており、特にテキストの分析は人間の行動や感情を反映した重要なデータとして注目されている。テキストマイニングとはデータマイニングのうち、テキストデータを対象とする技術である。テキストデータでは、構造化されたデータとは異なり同じ内容が様々な言語表現として表れるため、必要な情報を抽出するということが必要になる。この授業ではテキストの解析に必要な自然言語処理を中心としたテキストマイニングで用いられる技術の解説と、実際のデータを用いた演習を通じて分析・考察を行うことで、人や社会の現状や動向を柔軟な思考で複眼的、俯瞰的にとらえることができるよう目指す。
授業の到達目標
授業ではテキストマイニングの理論と技術に関する理解を深めたうえで、産業界や教育分野等で用いられるデータを用いて演習形式で実際の分析を行う。テキストマイニング技術を理解すること、実践的なスキルを身につけること、データ処理で留意すべき点などを理解することを目指す。自らの研究やプロジェクトにおいてテキストマイニングを適用するための基本的な理解を促進する。

(1)テキストマイニングの概念とその意義を説明することができる(DP2)
(2)テキストマイニングの基本的な分析手法を理解できる(DP1)
(3)テキストマイニングに用いられるツールの基本的な利用方法を説明することができる(DP1)
(4)データセットに適切なツールを適用し、データの前処理やデータの分析ができる(DP1)
(5)データ分析の結果から、結果についての解釈・考察を行うことができる(DP3)
授業計画
【全体】
授業の進め方について、テキストマイニング関する知識面と、データを用いた演習を行うことで分析に必要なスキル面、実際の演習を通じて分析した結果の発信や発表に必要な態度面の3つを伸ばせるよう、授業前の事前課題、授業中の講義やグループワーク、事後課題などを組み合わせて授業を展開する。

知識面では、産業界での具体的な課題事例や研究テーマから最新のものをいくつか紹介し、それぞれの課題の解決法を考えることを通じて、テキストマイニングに必要な自然言語処理などの基礎的な技術・理論とその応用について解説する。スキル面では、既存技術を自ら選択して利用できるようにするため、口コミデータを用いた演習を行う。課題のフィードバックとして提出後の講義において実例を示しながら解説を行う。

※履修人数により内容を変更することがあります。変更点があれば第1回目の授業でお知らせします。
項目 内容 授業時間外学習 備考
第1回 ガイダンス・テキストマイニングとは 授業の概略とその意義について説明する。その後、テキストマイニングの概念について解説する。 テキストの第1章・第2章を読んでくる。(学修時間の目安:2時間以上)
第2回 自然言語処理の基本① 自然言語処理における機械学習の基礎を説明する。形態素解析、構文解析(句構造解析)、構文解析(依存構造解析)、意味解析、談話解析について解説する。 自然言語処理を用いた研究論文を検索し、概要をまとめる。(学修時間の目安:4時間以上)
第3回 自然言語処理の基本② 自然言語処理における機械学習の基礎を説明する。形態素解析、構文解析(句構造解析)、構文解析(依存構造解析)、意味解析、談話解析について解説する。 自然言語処理の解析方法に関して授業内容をまとめる。(学修時間の目安:2時間以上)
第4回 テキストマイニングの応用とデータの収集方法 実社会におけるテキストマイニングの活用事例を紹介する。その後、データの収集方法を解説し、実際に授業で使用する口コミデータを取得する。 テキストマイニングを活用している事例を1つ調べ、まとめる。KHCoderをダウンロードする。第3章を読んで、機能を確認する。(学修時間の目安:6時間以上)
第5回 KHCoderの基本操作とテキストマイニング テキストマイニング用のツール(KHCoder)の基本的な使い方について解説する。
※授業の中で操作を行う。
口コミデータを確認する。第6章を読んでくる。(学修時間の目安:4時間以上)
第6回 データの確認と前処理① データ分析を行うには、データを理解する必要があり、実際に授業で使用する口コミデータについてExcelを活用してデータを理解するとともに、グループで討議を行う。 第3章の再確認、第4章と第10章を読んでくる。(学修時間の目安:4時間以上)
第7回 データの確認と前処理② テキストマイニングでは、データの前処理が必要であるため、その方法の解説を行う。その後、実際に口コミデータのデータクレンジングや前処理の作業を行う。 口コミデータの特色、データクレンジング・前処理作業をまとめる。(学修時間の目安:4時間以上)
第8回 共起ネットワーク① 多く出現する語を理解するための共起ネットワークとその解釈・活用方法について解説する。その後、実際に口コミデータを用いて共起ネットワークを作成する。 第5章・第6章を読んでくる。共起ネットワークの解釈をまとめる。(学修時間の目安:4時間以上)
第9回 共起ネットワーク② 共起ネットワークのさまざまな機能を解説し、実際に口コミデータを用いて実践する。結果についてはグループで討議を行う。 第7章・第8章を読んでくる。共起ネットワークの解釈をグループワークも踏まえまとめる。(学修時間の目安:4時間以上) グループワーク/ディスカッションを実施する
第10回 テキストマイニングの活用 実社会や企業におけるテキストマイニングの活用事例を紹介する。様々なデータの形式や解釈について解説する。 自身の研究におけるテキストデータの活用や分析方法について考え、まとめる。(学修時間の目安:6時間以上)
第11回 テキストマイニングの研究における活用① 事前課題として自身の研究における活用を考えてくる。それに基づいて、グループで実際の活用や応用、改善について討議する。 第9章・第11章を読んで、コーディングルールを1つ作成する。(学修時間の目安:4時間以上) グループワーク/ディスカッションを実施する
第12回 コーディングと対応分析 コーディングルールと対応分析について解説する。その後、実際に口コミデータを用いてコーディングルールの適応と分析を行う。 新しいコーディングルールを作成し、分析を行った結果をまとめる。(学修時間の目安:4時間以上)
第13回 テキストマイニングにおけるクラスタリング 各種統計手法によるテキストデータ群のクラススタリング分析とトピックモデルについて解説する。 自身の研究におけるテキストデータの活用や分析について新たな手法を検討し、まとめる。(学修時間の目安:4時間以上)
第14回 テキストマイニングの研究における活用② 授業自身の研究における活用の改善策や新しい視点を考えてくる。それに基づいて、グループで実際の活用や応用、改善について議論する。 オープンデータからデータを習得し、分析を行う(学修時間の目安:4時間以上) グループワーク/ディスカッションを実施する
第15回 感情分析と講義のまとめ 感情(ポジティブ・ネガティブ)に関する分析について分析方法やツール、活用について解説を行う。その後、講義のまとめ、研究における活用に対するアドバイスを行う。 オープンデータからデータを習得し、分析を行う(学修時間の目安:4時間以上) グループワーク/ディスカッションを実施する
※AL(アクティブ・ラーニング)欄に関する注
・授業全体で、AL(アクティブ・ラーニング)が占める時間の割合を、それぞれの項目ごとに示しています。
・A〜Dのアルファベットは、以下の学修形態を指しています。
【A:グループワーク】、【B:ディスカッション・ディベート】、【C:フィールドワーク(実験・実習、演習を含む)】、【D:プレゼンテーション】
A: 20% B: --% C: 60% D: 10%
成績評価法
授業の理解度に関する振り返りシート15%、事前事後課題30%、演習課題15%、グループワーク15%、最終レポート25%、で評価する。
教科書にかかわる情報
教科書 書名 動かして学ぶ!はじめてのテキストマイニング : フリー・ソフトウェアを用いた自由記述の計量テキスト分析 ISBN 9784779516399
著者名 樋口耕一, 中村康則, 周景龍著 出版社 ナカニシヤ出版 出版年 2022
備考
参考書にかかわる情報
参考書 書名 Rによるテキストマイニング入門 ISBN 9784627848429
著者名 石田基広著 出版社 森北出版 出版年 2017
備考
メッセージ
ノートパソコンを持参してください(Windowsのみ対応)
キーワード
持続可能な開発目標(SDGs)

関連科目
履修条件
授業でPCを使用しますので、各自で準備して下さい。
KH Coderを使用する予定ですが、Windowsの対応のみになります。(参考:https://khcoder.net/dl3.html
連絡先
maya.iwano@yamaguchi-u.ac.jp
オフィスアワー
随時(吉田キャンパス 共通教育棟3F)
※maya.iwano@yamaguchi-u.ac.jpにご連絡ください

ページの先頭へ