シラバス
※学期中に内容が変更になることがあります。

2020年度


10807635 

△翻訳解析
Machine Translation
2単位/Unit  秋学期/Fall  京田辺/Kyotanabe  講義/Lecture

  永田 昌明

<概要/Course Content Summary>

コンピュータを利用して,ある言語で書かれた自然言語の文を異なる言語に変換する「機械翻訳」と呼ばれる技術について基本的な原理とそれを実現する情報システムの実現方法について学習する。具体的には入力された文の形態素解析,構文解析,意味解析,および,それらをもとにした目的の言語への変換方法について学習する。また現在の主流であるニューラルネットを用いた機械翻訳についても学習する。

<到達目標/Goals,Aims>

機械翻訳の原理を学ぶことを通じてコンピュータで自然言語を扱うための基本知識と基本技術を習得し,身近な言語処理システム(例えば「かな漢字変換」)の動作原理を説明したり,簡単な言語処理システムの仕様を設計できることを目標とする。

<授業計画/Schedule>

(実施回/
Week)
(内容/
Contents)
(授業時間外の学習/
Assignments)
(実施回/ Week) (内容/ Contents) はじめに 
本科目の講義の概要を紹介し,機械翻訳の歴史や機械翻訳の基礎となる自然言語処理技術について概観する 
(授業時間外の学習/ Assignments) 予習・復習 
(実施回/ Week) (内容/ Contents) 形態素解析 
自然言語処理の基本中の基本である,文を形態素(意味を持つ最小の単位)に分割する方法について学ぶ 
(授業時間外の学習/ Assignments) 予習・復習 
(実施回/ Week) (内容/ Contents) 言語モデルとコーパス 
Ngramモデルなど形態素解析で使用する確率統計モデル,および,コーパス(テキストデータベース)について学ぶ 
(授業時間外の学習/ Assignments) 予習・復習 
(実施回/ Week) (内容/ Contents) 構文解析 
構文解析とは何か,句構造と係り受け(依存構造)の違い,および,形式言語理論の基礎について学ぶ 
(授業時間外の学習/ Assignments) 予習・復習 
(実施回/ Week) (内容/ Contents) 句構造の基づく構文解析 
句構造(文脈自由文法)に基づく構文解析ついて学ぶ 
(授業時間外の学習/ Assignments) 予習・復習 
(実施回/ Week) (内容/ Contents) 係り受けに基づく構文解析 
係り受け(依存構造)に基づく構文解析について学ぶ 
(授業時間外の学習/ Assignments) 予習・復習 
(実施回/ Week) (内容/ Contents) 意味解析 
意味解析とは何か,テキスト分類,語義曖昧性解消,固有表現抽出,述語項構造解析などについて学ぶ。 
(授業時間外の学習/ Assignments) 予習・復習 
(実施回/ Week) (内容/ Contents) ルールベース機械翻訳 
翻訳規則に基いて構文構造または意味構造を原言語から目的言語へ変換するトランスファ方式について学ぶ。 
(授業時間外の学習/ Assignments) 予習・復習 
(実施回/ Week) (内容/ Contents) 統計的機械翻訳 
統計的機械翻訳とは何か,単語翻訳モデルの基本としてIBM翻訳モデルについて学ぶ 
(授業時間外の学習/ Assignments) 予習・復習 
(実施回/ Week) 10  (内容/ Contents) 句に基づく統計的機械翻訳 
英語とフランス語など距離が近い言語間の翻訳に向いている句に基づく翻訳モデルについて学ぶ 
(授業時間外の学習/ Assignments) 予習・復習 
(実施回/ Week) 11  (内容/ Contents) 木に基づく統計的機械翻訳 
日本語と英語など距離が遠い言語間の翻訳の実現するための事前並べ替えおよび木に基づく翻訳モデルについて学ぶ 
(授業時間外の学習/ Assignments) 予習・復習 
(実施回/ Week) 12  (内容/ Contents) ニューラルネット入門 
最も基本となる順伝播ニューラルネットワーク,および,活性化関数・損失失関数・勾配などの基本的な概念を学ぶ 
(授業時間外の学習/ Assignments) 予習・復習 
(実施回/ Week) 13  (内容/ Contents) ニューラル言語モデルと単語埋め込み 
再帰ニューラルネットワーク,および,これに基づく言語モデルや単語の意味の表現法(単語埋め込み)を学ぶ 
(授業時間外の学習/ Assignments) 予習・復習 
(実施回/ Week) 14  (内容/ Contents) ニューラル機械翻訳 
注意付きエンコーダデコーダモデルやTransformerなどニューラルネットを用いた機械翻訳について学ぶ 
(授業時間外の学習/ Assignments) 予習・復習 
(実施回/ Week) 15 
 
(内容/ Contents) 機械翻訳の精度の自動評価 
形態素解析,構文解析,機械翻訳の精度を評価する方法を学びながら,本科目の講義の内容を復習する 
(授業時間外の学習/ Assignments) 予習・復習 

<成績評価基準/Evaluation Criteria>

平常点(出席,練習問題,レポート等)  35%  出席+授業時間内に課する課題の提出 
期末筆記試験  65%  各回で取り上げた内容について理解しているかどうかを評価します 

自然言語処理に関する基本的な用語を理解していること,および,形態素解析・構文解析・機械翻訳を実現する基本的なアルゴリズムを理解していることを評価のポイントとする。

 

<成績評価結果/Results of assessment>   成績評価の見方について/Notes for assessment

    

登録者数

成績評価(%)

評点
平均値

備考

A B C D F
30 26.7 30.0 20.0 0.0 23.3 0.0 2.4 *

<参考文献/Reference Book>

金 明哲,村上 征勝,永田 昌明,大津 起夫,山西 健司  『言語と心理の統計-ことばと行動の確率モデルによる分析-』(岩波書店、2003)本講義の前半は,本書の第II部「確率モデルによる自然言語処理」(永田著)に基づく 
 

Philipp Koehn , Statistical Machine Translation .   (Cambridge University Press, 2010) .  統計的機械翻訳に関する初めての本格的な教科書であり,本講義の後半は本書に基づく 

 

渡辺太郎,今村賢治,賀沢秀人,Graham Neubig, 中澤敏明  『機械翻訳』(コロナ社、2014)日本語で書かれた統計的機械翻訳に関する教科書 
 

高村 大也  『言語処理のための機械学習入門』(コロナ社、2010)本講義で学ぶ自然言語処理の背景にある機械学習理論について分かりやすく解説した教科書 
 

斎藤康毅  『ゼロから作るDeep Learning』(オライリー・ジャパン、2016)深層学習(ニューラルネット)に関する教科書。本講義のニューラルネットの説明は本書に基づく 
 

坪井祐太,海野裕也,鈴木潤  『深層学習による自然言語処理』(講談社、2017)ニューラルネットを用いた自然言語処理に関する教科書 
 

斎藤康毅  『ゼロから作るDeep Learning 2 --自然言語処理編-』(オライリー・ジャパン、2018)再帰ニューラルネット(RNN),ニューラル言語モデル,ニューラル機械翻訳などを分かりやすく解説している。 
 

<参照URL/URL>

Statistical Machine Translation 
統計的機械翻訳に関するポータル 
アジア太平洋機械翻訳協会 
機械翻訳に関する業界団体 
OpenNMT 
ニューラル機械翻訳を実装した代表的なフリーソフトウェア 

<備考/Remarks>

講義で使用するテキスト(スライド)および課題はe-classからダウンロードできる 

 

お問合せは同志社大学 各学部・研究科事務室まで
 
Copyright(C) 2020 Doshisha University All Rights Reserved. 無断転載を禁止します。