rnishino

IT翻訳者Blog

翻訳、英語、ローカリゼーション、インターナショナリゼーションなどについて書いています。

5 2月

ホフスタッター氏による機械翻訳考察

『ゲーデル、エッシャー、バッハ』という本で有名なダグラス・ホフスタッター氏が機械翻訳(Google翻訳)について批判的に考察した記事を書いています。
英語の長文なので誰にでもお勧めできるわけではないですが、簡単にまとめると、いまの機械翻訳はあくまでデータを機械処理をしているだけであって、人間がやるのと同等の「翻訳」ではないという点です。人間と同じ「翻訳」を実現するにはまだまだ時間がかかりそうだと述べています。

The Shallowness of Google Translate
https://www.theatlantic.com/technology/archive/2018/01/the-shallowness-of-google-translate/551570/
(補足:本文中で仏独中の対訳サンプル部分が出てきますが、そこは飛ばしても大丈夫です)



印象に残った部分をいくつか引用し、私のコメントを付けてみます。

Google Translate isn’t familiar with situations, period. It’s familiar solely with strings composed of words composed of letters.
Google翻訳では文章が書かれた「状況」まで考慮せず、字面だけしか扱っていないということですね。人が言葉を解釈するには、その場の雰囲気なり常識なり人間関係なり、テキストの「外」にある情報も必要です。いまの機械翻訳ではそれをしていません。

Well, I chuckled at these poor shows, relieved to see that we aren’t, after all, so close to replacing human translators by automata.
人間の翻訳者が機械にすぐに置き換えられるわけではないと言っています。

I am not, in short, moving straight from words and phrases in Language A to words and phrases in Language B. Instead, I am unconsciously conjuring up images, scenes, and ideas, dredging up experiences I myself have had (or have read about, or seen in movies, or heard from friends), and only when this nonverbal, imagistic, experiential, mental “halo” has been realized—only when the elusive bubble of meaning is floating in my brain—do I start the process of formulating words and phrases in the target language, and then revising, revising, and revising.
翻訳者は言語Aから言語Bに直接置き換えているわけではなく、イメージを思い浮かべ、その意味を捉えてターゲット言語を作り出し、推敲を重ねるというプロセスを踏んでいるということです。
これは翻訳をやっている人ならよく分かる話だと思います。原文はあくまで元ネタであり、それを使って訳文を新たに書き起こしているという感じでしょうか。

To understand such failures, one has to keep the eliza effect in mind. The bailingual engine isn’t reading anything—not in the normal human sense of the verb “to read.” It’s processing text. The symbols it’s processing are disconnected from experiences in the world.
ELIZA効果」というものがあるそうです。これはコンピューターをいわば擬人化してしまうということです。コンピューターは単にテキスト処理しているのに、それを「読む」という人間の行為になぞらえて考えてしまうということです。
私も機械"翻訳"と呼ぶのは本当は良くないのではないかと前々から思っていました。「翻訳」と名付けてしまった時点で、それは人間の翻訳という行為と同じであると誤認してしまいます。

Despite my negativism, Google Translate offers a service many people value highly: It effects quick-and-dirty conversions of meaningful passages written in language A into not necessarily meaningful strings of words in language B. As long as the text in language B is somewhat comprehensible, many people feel perfectly satisfied with the end product. If they can “get the basic idea” of a passage in a language they don’t know, they’re happy. This isn’t what I personally think the word “translation” means, but to some people it’s a great service, and to them it qualifies as translation.
Google翻訳は便利で「大体の意味がわかる」と喜ぶ人も多いが、それは自分が考える「翻訳」とは呼ばない、ということです。役に立つサービスではあるが、翻訳ではないということです。



この記事を読んだとき、私が考えている機械翻訳像とかなり近くて驚きました。たとえば以前、こんなブログ記事を書きました:
・機械で「翻訳」をしているのか
http://blog.nishinos.com/archives/5023862.html
・機械翻訳は「翻訳」をしていない(が役に立つ)
http://blog.nishinos.com/archives/5300408.html


いまは人工知能ブームとあいまって、いわゆる文系で翻訳を研究しているような人も機械翻訳にのめり込んでいる状況です(研究費がもらえますから…)。
こういう熱狂のときにこそ批判的に捉え、機械に何ができて何ができないのか、「翻訳」とは何なのか、しっかり考察しておきたいものです。
1 2月

Kindle月替りセールに『英語語源が魔術に変わる世界では』

アマゾンKindleストアの「月替りセール」の対象タイトルとして、私の『英語語源が魔術に変わる世界では』が選ばれています。
セール期間は、2/1〜2/28までです。





Kindleストアでこういったセール対象に入るには、大きな出版社じゃないと厳しいかなとも思っていたのですが、幸運にも対象に選んでもらえました。
これは、やはりある程度読まれていたのが背景にあるはずで、すでにご購入くださった皆さまのおかげだと思います。ありがとうございました。
4 1月

機械翻訳の自動評価が簡単にできるソフトウェアを作成

機械翻訳の「自動評価」には、BLEUなどのスコアがよく用いられます。
これは人間が(お手本として)訳した参照訳と、機械翻訳の訳とがどれほど近いかを計算して評価する方法です。

「I have a pen.」という英語原文に対し、人間がお手本として「私はペンを持つ。」と翻訳したとします。
同じ原文に対し、機械翻訳システムAとBが以下のように出力したとします。
・システムA: 私はペンを所有する。
・システムB: 俺はペンを持つ。

どちらもどちらという気もしますが、たとえばBLEUで計算すると、Aのスコアは「0.4347」、Bのスコアは「0.7598」となり、Bの方がより参照訳に近いという結果になります。



これまでも自動評価を実行できるソフトウェアは存在していたのですが、コマンド入力が基本だったので、慣れたITエンジニアでないとハードルが高いという欠点がありました。
昨今は機械翻訳が話題にされることも多く、翻訳業界の人であればエンジニアでなくても自動評価がどのようなものか把握しておく必要はあるでしょう。

そこで、コマンドを使わなくてもGUIで簡単に自動評価をできるソフトウェアを作ってみました。
Windows版とMac版があります。
Windows版はWindows 10で、Mac版はOS 10.12で動作確認しています。それ以外のOSで動くかは不明です。
自動評価でよく使われる「BLEU」と、Google独自のBLEUスコアである「GLEU」が計算できます。



使い方を説明します。

【1】まず以下のURLからソフトウェアをダウンロードしてください。画面右上にある下矢印ボタンでダウンロードできます(サイズはそこそこ大きい)。
また本ソフトウェアは無償でご利用いただけます。

こちらに移動しました(2018/01/19): http://www.nishinos.com/simple-mt-score
・Windows版
https://goo.gl/ytqjcd
・Mac版
https://goo.gl/pMgt5b


【2-A】Windows版の場合、zipを解凍すると以下のフォルダーが出現します。

1_files

ここで「SimpleMTScore.exe」をダブルクリックすると起動します。

【2-B】Mac版の場合、zipを解凍してSimpleMTScore.appをダブルクリックすると起動します。

【3】起動後、まず「参照訳を入力:」の下に、お手本となる訳を入力します。複数のセンテンスがある場合、改行で区切ります。同様に「評価訳を入力:」の下に機械翻訳の出力を入れます。
参照訳と評価訳のセンテンスは数を同じにし、各センテンスが対応するようにしておいてください。

2_gui

【4】続いて「実行」を押すと、BLEUスコアとGLEUスコアが表示されます。


その他の関連情報はソフトウェア内の「ヘルプ」メニューからご覧ください。
また、バグなどがあったら biz@nishinos.com までお知らせいただけると幸いです。

以上です。
著書
ソフトウェアグローバリゼーション入門
インプレス刊
『ソフトウェアグローバリゼーション入門』

達人出版会刊
『ソフトウェア・グローバリゼーション入門』


英語語源が魔術に変わる世界では
『英語語源が魔術に変わる世界では』


現場で困らない! ITエンジニアのための英語リーディング
『IT英語リーディング』


アプリケーションをつくる英語
紙版
『アプリケーションをつくる英語』

電子版
『アプリケーションをつくる英語』
第4回ブクログ大賞受賞】