先日のJTF翻訳祭で、高橋さきのさんと深井裕美子さんによる「翻訳の過去・現在・未来 〜解体新書からAI、そしてその先へ〜」という講演を拝聴した。
その中で、高橋さんがAI時代では「翻訳」をきちんと定義すべきだとを仰っていた。

これにはまったく賛成である。
昨年のGoogleニューラル機械翻訳(GNMT)の登場により、翻訳者や翻訳会社が数年内にも不要になるのではという話を聞くようになった。しかしそれはあり得ないだろう。そういった話が出回るのは「翻訳」が何かということの考察が不足しているためではないか。

以前、私はまだGNMTが登場する前(2016年3月)に「機械で『翻訳』をしているのか」というブログ記事を書いた。機械翻訳ではテキスト外部の文脈を考慮しておらず、それは「翻訳」とは言えないのではないかという立場である。
「翻訳」が成り立つためには「テキスト内部の情報」と「テキスト外部の文脈情報」の両方が必要ということだ。

ではGNMTの登場で、状況は変わったのだろうか?
変わっていない。
ルールベースの機械翻訳ではテキスト内部の文法構造、統計的機械翻訳やニューラル機械翻訳では過去の対訳テキストを利用しており、テキスト外部にある文脈情報は用いていない。
(ちなみにセンサーなどを使ってその場の情報を部分的に集めようという研究もあるようだが、まだこれからのようだ。)

つまり、GNMTも含めて現在の機械翻訳はテキスト内部の情報だけを使っている。一方、人間はテキスト内部の情報に加え、テキスト外部にある文脈情報も使っている。機械は人間がする翻訳の一部しかできていないのだ。
翻訳祭で高橋さんも仰っていたが、機械翻訳がしているのは、テキスト情報に基づく言語処理に過ぎない。



この翻訳の問題は、昨今の人工知能ブームで耳にする機会が増えた「強い人工知能」と「弱い人工知能」とも関連していそうだ。これらは以下のように定義される。
強い人工知能(Strong AI):知能を持つ機械(精神を宿す)。
弱い人工知能(Weak AI):人間の知能の代わりの一部を行う機械。

― 松田雄馬・著『人工知能の哲学』(東海大学出版会)p. 178より引用
(ちなみに同書は現在のブームを批判的に考察したい人にお勧めしたい。知は身体があって初めて生まれるものであって、身体を持たない機械は人間のような知は持ち得ないという話が書いてある)

現在の機械翻訳は「弱い人工知能」ということになるだろう。上記のように、現在の機械翻訳はテキスト内部の情報しか使っておらず、「翻訳」が成立するためには人間がテキスト外部の文脈を補う必要がある。

そういった意味では機械翻訳の「ポストエディット」という言葉は、実は誤解を招く。
ポストエディットは「翻訳が終わった後(post)の編集」という意味だが、そもそも機械は「翻訳」をしていないため、人間が手を入れる(編集する)必要がある。人が手を入れる前までは「翻訳」ではないため、ポストエディットという言葉ではおかしい。



機械翻訳は「翻訳」をしていないと述べたが、しかし人間にとって大いに役立つ。機械翻訳は「弱い人工知能」であり、人間の知能の一部を代替する。翻訳者や翻訳会社はこれにどう向き合うべきだろうか。
現在の私の意見としては、辞書と同じような「ツール」と捉えるべきだと考えている。

辞書は1つの「語」について訳語候補を提示してくれる。例えばrightには「権利」や「右」という訳語候補がある。最終的には人間がテキスト内外の文脈を判断し、どれを採用するか決めることになる。
一方、現在の機械翻訳では、ほどほどの訳文候補を提示してくれる。人間は文脈を勘案しつつ、修正を加えたり、文に含まれる一部の語のみを採用したり、あるいは完全に却下して自分で全部訳したりして、翻訳を完成させればよい。

現在の機械翻訳は「翻訳」をしているわけではないため、翻訳者や翻訳会社は過度に恐れる必要もないだろう。しかしテキスト外部の文脈情報をきちんと活用する力がなければ機械翻訳と同じことをしているということになり、仕事は無くなるかもしれない。