rnishino

IT翻訳者Blog

翻訳、英語、ローカリゼーション、インターナショナリゼーションなどについて書いています。

11 12月

達人出版会版『ソフトウェア・グローバリゼーション入門』が正式版に

達人出版会版『ソフトウェア・グローバリゼーション入門』はバージョンが0.9でしたが、修正を終えて正式版になりました。
価格は1,600円です。

g11n-v1

同タイトルでインプレス版も販売されていていますが、少し違いがあります。
インプレス版には企業インタビューの章が追加されており、価格は2,400円です。

少し高くても企業インタビューも読みたい方はインプレス版、インタビューは不要なので低い価格で買いたいという方はこちらの達人出版会版をどうぞ。
1 12月

機械翻訳は「翻訳」をしていない(が役に立つ)

先日のJTF翻訳祭で、高橋さきのさんと深井裕美子さんによる「翻訳の過去・現在・未来 〜解体新書からAI、そしてその先へ〜」という講演を拝聴した。
その中で、高橋さんがAI時代では「翻訳」をきちんと定義すべきだとを仰っていた。

これにはまったく賛成である。
昨年のGoogleニューラル機械翻訳(GNMT)の登場により、翻訳者や翻訳会社が数年内にも不要になるのではという話を聞くようになった。しかしそれはあり得ないだろう。そういった話が出回るのは「翻訳」が何かということの考察が不足しているためではないか。

以前、私はまだGNMTが登場する前(2016年3月)に「機械で『翻訳』をしているのか」というブログ記事を書いた。機械翻訳ではテキスト外部の文脈を考慮しておらず、それは「翻訳」とは言えないのではないかという立場である。
「翻訳」が成り立つためには「テキスト内部の情報」と「テキスト外部の文脈情報」の両方が必要ということだ。

ではGNMTの登場で、状況は変わったのだろうか?
変わっていない。
ルールベースの機械翻訳ではテキスト内部の文法構造、統計的機械翻訳やニューラル機械翻訳では過去の対訳テキストを利用しており、テキスト外部にある文脈情報は用いていない。
(ちなみにセンサーなどを使ってその場の情報を部分的に集めようという研究もあるようだが、まだこれからのようだ。)

つまり、GNMTも含めて現在の機械翻訳はテキスト内部の情報だけを使っている。一方、人間はテキスト内部の情報に加え、テキスト外部にある文脈情報も使っている。機械は人間がする翻訳の一部しかできていないのだ。
翻訳祭で高橋さんも仰っていたが、機械翻訳がしているのは、テキスト情報に基づく言語処理に過ぎない。



この翻訳の問題は、昨今の人工知能ブームで耳にする機会が増えた「強い人工知能」と「弱い人工知能」とも関連していそうだ。これらは以下のように定義される。
強い人工知能(Strong AI):知能を持つ機械(精神を宿す)。
弱い人工知能(Weak AI):人間の知能の代わりの一部を行う機械。

― 松田雄馬・著『人工知能の哲学』(東海大学出版会)p. 178より引用
(ちなみに同書は現在のブームを批判的に考察したい人にお勧めしたい。知は身体があって初めて生まれるものであって、身体を持たない機械は人間のような知は持ち得ないという話が書いてある)

現在の機械翻訳は「弱い人工知能」ということになるだろう。上記のように、現在の機械翻訳はテキスト内部の情報しか使っておらず、「翻訳」が成立するためには人間がテキスト外部の文脈を補う必要がある。

そういった意味では機械翻訳の「ポストエディット」という言葉は、実は誤解を招く。
ポストエディットは「翻訳が終わった後(post)の編集」という意味だが、そもそも機械は「翻訳」をしていないため、人間が手を入れる(編集する)必要がある。人が手を入れる前までは「翻訳」ではないため、ポストエディットという言葉ではおかしい。



機械翻訳は「翻訳」をしていないと述べたが、しかし人間にとって大いに役立つ。機械翻訳は「弱い人工知能」であり、人間の知能の一部を代替する。翻訳者や翻訳会社はこれにどう向き合うべきだろうか。
現在の私の意見としては、辞書と同じような「ツール」と捉えるべきだと考えている。

辞書は1つの「語」について訳語候補を提示してくれる。例えばrightには「権利」や「右」という訳語候補がある。最終的には人間がテキスト内外の文脈を判断し、どれを採用するか決めることになる。
一方、現在の機械翻訳では、ほどほどの訳文候補を提示してくれる。人間は文脈を勘案しつつ、修正を加えたり、文に含まれる一部の語のみを採用したり、あるいは完全に却下して自分で全部訳したりして、翻訳を完成させればよい。

現在の機械翻訳は「翻訳」をしているわけではないため、翻訳者や翻訳会社は過度に恐れる必要もないだろう。しかしテキスト外部の文脈情報をきちんと活用する力がなければ機械翻訳と同じことをしているということになり、仕事は無くなるかもしれない。
22 11月

産業翻訳を考える研究会が必要かもしれない

翻訳を仕事にするには、少なくとも大学卒業レベルの語学力を基礎として持っている必要がある。
そのため本当に翻訳の勉強をしたければ大学卒業後ということになり、もし学校システムに乗るなら大学院でということになる。
ところが日本には翻訳を学べる大学院が少ない。さらに「産業翻訳」を大きく扱っている学校はほとんどないのが現状だ。
翻訳ビジネス需要の大部分が産業翻訳であるから社会的な必要性はあるはずなのに、それに応えようとする大学が極めて少ないのは残念な限りである。

その結果、大学教育と翻訳産業との連携もない。
例えば藤田氏(情報通信研究機構)と山田氏(関西大学)の論文にも以下のようにある。

そのような人材・スキルをどのように育成するかに関するb)翻訳産業とc)翻訳者の養成の2群間の連携は希薄である
http://www.anlp.jp/proceedings/annual_meeting/2017/pdf_dir/D6-1.pdf

上記は機械翻訳が関わる状況ではあるが、機械翻訳が関係しなくても、大学教育と翻訳産業の連携は弱い。

大学教育と翻訳産業がうまく連携するためには、上記論文中の図にもあるように、大学が優れた「人材」を供給し、翻訳産業がそれを「雇用」するという関係が必要だ。
連携がうまくいかない最大の理由は、翻訳産業が求めるような「人材」を供給できていない点にあると思う。
冒頭で述べたように大学や大学院に「産業翻訳」の授業はほとんどない。
さらに学会は、実は翻訳産業に関心を持っていない。これは学会発表や論文集に掲載されているテーマを見れば分かる。大学が人材を送り出すのなら、翻訳産業でどのようなニーズがあるのか研究が必要のはずだが、そういった研究がなされていないのだ。
だから大学では翻訳産業で求められる人材を育てられていない。大学と翻訳産業はいわゆるウィン・ウィンの関係になっておらず、もし学生を雇用しても企業内で教育し直さなければならないのだ。
またすでに働いている人の再教育システム(例:社会人大学院)も皆無であるため、雇用と人材供給の間で良いサイクルが存在しない。



以前「ISO 17100の翻訳者資格を取るために大学院に行くべきか」という記事で、翻訳者になりたいなら働きながら翻訳学校に行くべきだと書いた。
その認識は変わっていないが、企業である翻訳学校で弱いと思われるのは、抽象化や理論化をして社会に還元するという機能だ。翻訳産業との協力しつつ大学や学会が力を発揮できるとしたら、そういった部分かもしれない。

産業翻訳には、ほかの翻訳にはあまり見られない特徴がある。例えば、複数人で同時に分担翻訳したり、過去の訳文に合わせて翻訳したりする。そのために翻訳メモリー(TM)を使ったり、用語集やスタイルガイドで言葉や表現の統一を図ったりする必要がある。また教師や評論家の主観ではなく、客観的な品質評価手法で翻訳成果物を評価する。
こういった独特な特徴も持つ産業翻訳について解明し、職人技と呼ばれるような部分などで抽象化や理論化を行うのである。

私自身、日本翻訳連盟(JTF)の理事となり、翻訳産業全体の将来について以前よりも考えるようになった。
その一環で、産業翻訳に関して抽象化や理論化を進めたり、さらにそれに基づいて教育手法を考案したりといった面も推進すべきではないかと感じている。
もしかしたら産業翻訳のみを専門に扱う新しい研究会のようなものを立ち上げる必要があるのかもしれない。
(通訳翻訳関係の某学会は、大学教員が中心、翻訳と通訳が一緒、文芸翻訳や西洋理論の研究が多い、といった理由で、産業翻訳を扱うのは難しいという印象がある。)
筆者について
西野 竜太郎
(Ryutaro Nishino)

翻訳者。合同会社グローバリゼーションデザイン研究所・代表社員。日本翻訳連盟・理事。
プロフィールや連絡先などについては会社のウェブサイトをご覧ください。
著書
ソフトウェアグローバリゼーション入門
インプレス刊
『ソフトウェアグローバリゼーション入門』

達人出版会刊
『ソフトウェア・グローバリゼーション入門』


現場で困らない! ITエンジニアのための英語リーディング
『IT英語リーディング』


アプリケーションをつくる英語
紙版
『アプリケーションをつくる英語』

電子版
『アプリケーションをつくる英語』
第4回ブクログ大賞受賞】