rnishino

IT翻訳者Blog

翻訳、英語、ローカリゼーション、インターナショナリゼーションなどについて書いています。

25 12月

東京GILT会イベント「ソフトウェアと翻訳」が1/27に

ウェブやアプリといったソフトウェアを多言語化して海外のユーザーに使ってもらうには、インターナショナリゼーション(I18N)やローカリゼーション(L10N)が必要です。
しかし主に前者はプログラマー、後者は翻訳者が分業しているのが現状です。いわゆるウォーターフォール型開発が主流だった時代には機能していたかもしれませんが、緊密なコミュニケーションが求められるアジャイル型が主流となった現在、分業は弊害の方が大きいかもしれません。
長らく分業されてきたためか、残念ながら関係者(プログラマー、デザイナー、翻訳者、PMなど)間の人的交流は活発とは言えません。

そこで、WordPressの翻訳もされている高野直子さんと「東京GILT会」というグループを作り、2018/1/27(土)に第1回イベントとして「ソフトウェアと翻訳」を開催することにしました。
ちなみにGILTとは、Globalization、Internationalization、Localization、Translationの頭文字です。

申し込みなどはこちら:

【東京GILT会】ソフトウェアと翻訳 #1
https://tokyogilt.connpass.com/event/74721/

gilt_1

ご興味のある方はぜひご参加ください。
11 12月

達人出版会版『ソフトウェア・グローバリゼーション入門』が正式版に

達人出版会版『ソフトウェア・グローバリゼーション入門』はバージョンが0.9でしたが、修正を終えて正式版になりました。
価格は1,600円です。

g11n-v1

同タイトルでインプレス版も販売されていていますが、少し違いがあります。
インプレス版には企業インタビューの章が追加されており、価格は2,400円です。

少し高くても企業インタビューも読みたい方はインプレス版、インタビューは不要なので低い価格で買いたいという方はこちらの達人出版会版をどうぞ。
1 12月

機械翻訳は「翻訳」をしていない(が役に立つ)

先日のJTF翻訳祭で、高橋さきのさんと深井裕美子さんによる「翻訳の過去・現在・未来 〜解体新書からAI、そしてその先へ〜」という講演を拝聴した。
その中で、高橋さんがAI時代では「翻訳」をきちんと定義すべきだとを仰っていた。

これにはまったく賛成である。
昨年のGoogleニューラル機械翻訳(GNMT)の登場により、翻訳者や翻訳会社が数年内にも不要になるのではという話を聞くようになった。しかしそれはあり得ないだろう。そういった話が出回るのは「翻訳」が何かということの考察が不足しているためではないか。

以前、私はまだGNMTが登場する前(2016年3月)に「機械で『翻訳』をしているのか」というブログ記事を書いた。機械翻訳ではテキスト外部の文脈を考慮しておらず、それは「翻訳」とは言えないのではないかという立場である。
「翻訳」が成り立つためには「テキスト内部の情報」と「テキスト外部の文脈情報」の両方が必要ということだ。

ではGNMTの登場で、状況は変わったのだろうか?
変わっていない。
ルールベースの機械翻訳ではテキスト内部の文法構造、統計的機械翻訳やニューラル機械翻訳では過去の対訳テキストを利用しており、テキスト外部にある文脈情報は用いていない。
(ちなみにセンサーなどを使ってその場の情報を部分的に集めようという研究もあるようだが、まだこれからのようだ。)

つまり、GNMTも含めて現在の機械翻訳はテキスト内部の情報だけを使っている。一方、人間はテキスト内部の情報に加え、テキスト外部にある文脈情報も使っている。機械は人間がする翻訳の一部しかできていないのだ。
翻訳祭で高橋さんも仰っていたが、機械翻訳がしているのは、テキスト情報に基づく言語処理に過ぎない。



この翻訳の問題は、昨今の人工知能ブームで耳にする機会が増えた「強い人工知能」と「弱い人工知能」とも関連していそうだ。これらは以下のように定義される。
強い人工知能(Strong AI):知能を持つ機械(精神を宿す)。
弱い人工知能(Weak AI):人間の知能の代わりの一部を行う機械。

― 松田雄馬・著『人工知能の哲学』(東海大学出版会)p. 178より引用
(ちなみに同書は現在のブームを批判的に考察したい人にお勧めしたい。知は身体があって初めて生まれるものであって、身体を持たない機械は人間のような知は持ち得ないという話が書いてある)

現在の機械翻訳は「弱い人工知能」ということになるだろう。上記のように、現在の機械翻訳はテキスト内部の情報しか使っておらず、「翻訳」が成立するためには人間がテキスト外部の文脈を補う必要がある。

そういった意味では機械翻訳の「ポストエディット」という言葉は、実は誤解を招く。
ポストエディットは「翻訳が終わった後(post)の編集」という意味だが、そもそも機械は「翻訳」をしていないため、人間が手を入れる(編集する)必要がある。人が手を入れる前までは「翻訳」ではないため、ポストエディットという言葉ではおかしい。



機械翻訳は「翻訳」をしていないと述べたが、しかし人間にとって大いに役立つ。機械翻訳は「弱い人工知能」であり、人間の知能の一部を代替する。翻訳者や翻訳会社はこれにどう向き合うべきだろうか。
現在の私の意見としては、辞書と同じような「ツール」と捉えるべきだと考えている。

辞書は1つの「語」について訳語候補を提示してくれる。例えばrightには「権利」や「右」という訳語候補がある。最終的には人間がテキスト内外の文脈を判断し、どれを採用するか決めることになる。
一方、現在の機械翻訳では、ほどほどの訳文候補を提示してくれる。人間は文脈を勘案しつつ、修正を加えたり、文に含まれる一部の語のみを採用したり、あるいは完全に却下して自分で全部訳したりして、翻訳を完成させればよい。

現在の機械翻訳は「翻訳」をしているわけではないため、翻訳者や翻訳会社は過度に恐れる必要もないだろう。しかしテキスト外部の文脈情報をきちんと活用する力がなければ機械翻訳と同じことをしているということになり、仕事は無くなるかもしれない。
著書
ソフトウェアグローバリゼーション入門
インプレス刊
『ソフトウェアグローバリゼーション入門』

達人出版会刊
『ソフトウェア・グローバリゼーション入門』


英語語源が魔術に変わる世界では
『英語語源が魔術に変わる世界では』


現場で困らない! ITエンジニアのための英語リーディング
『IT英語リーディング』


アプリケーションをつくる英語
紙版
『アプリケーションをつくる英語』

電子版
『アプリケーションをつくる英語』
第4回ブクログ大賞受賞】