rnishino

IT翻訳者Blog

翻訳、英語、ローカリゼーション、インターナショナリゼーションなどについて書いています。

20 5月

「ITエンジニアが芭蕉と学ぶ英語構文」の第5〜6回

連載記事「ITエンジニアが芭蕉と学ぶ英語構文」の第5〜6回が公開されています。

basho-title

芭蕉たちは栃木市の「室の八島」を経て、日光東照宮を参詣しています。

【第5回】可能(5)と室の八島
https://globalization.co.jp/english-with-basho/05/

取り上げている英語構文: [無生物主語] [be動詞] available (at/in/for [場所/物]).

【第6回】不可能(1)と日光
https://globalization.co.jp/english-with-basho/06/

取り上げている英語構文: [無生物主語] fail to [動詞].


以上です。
8 5月

個人でもトレーニングできそうなNMTシステム

マイクロソフトが提供する機械翻訳サービス「Microsoft Translator」が更新された。大きな改善の1つとして、ニューラルMTをカスタマイズできる機能が追加されている。

Customized neural machine translation with Microsoft Translator
https://www.microsoft.com/en-us/research/blog/customized-neural-machine-translation-microsoft-translator/

記事を読むと、マイクロソフトの汎用MTシステムに対し、ユーザーが対訳文を追加することで、システムをトレーニングしてカスタマイズできるようだ。自分の専門分野や社内文書でトレーニングすることで、その分野により適合した訳文が出力されるようになる。
ただし、最低でも2,000以上の対訳文セットが必要とある。

以下の図を見ると、対訳を10,000(Very small)、10,000〜50,000(Small)、50,000〜10,000(Medium)、または100,000+(Large)追加してBLEU値を計算しているが、SmallやMedium程度でもそこそこの改善が見られるようだ。

Build_Table
引用元:https://www.microsoft.com/en-us/research/blog/customized-neural-machine-translation-microsoft-translator/

しかし、私がこの記事を読んで驚いたのはこの点である:
…, the computing power necessary to custom train represents less than 1% of the GPU computing power necessary if training were to start from a blank slate model.

なんと、ゼロからトレーニングする場合に比べ、GPU使用は1%未満で済むようだ。
実のところ、自分でトレーニングして自分(自社)用NMTシステムを作ることは可能である。たとえばOpenNMTのようなオープンソースのNMTソフトウェアも無料で入手できる。
ところが、GPUというハードウェアは数十万円もして高価な上、トレーニングにかなりの時間(数日では済まない)がかかる。

これは一見、地味なニュースに思えるかもしれないが、翻訳会社の視点からすると実はかなり大きなニュースではないだろうか。
数万程度の対訳セットなら中小規模の翻訳会社、場合によっては個人翻訳者でも準備できる。
自分の専門分野で訳してきた対訳の蓄積があれば、自分用のNMTシステムを簡単に構築できそうだ(もちろん法的側面のクリアが必要かもしれないが)。
これまでNMT導入に遅れたり、予算がなかったりした翻訳会社も手が届く。

なお、通常はトレーニング時に、対訳は1文ずつセットにしておかなければならない。しかしマイクロソフトのは文章に自動的にアラインメント(1文ずつのセットに揃えること)をかけてくれるようだ。100%完璧ではないかもしれないが、これで中小企業や個人はさらに楽になる。

OpenNMTは手間がかかるので試したことはなかったが、こちらはハードルがさらに低そうなので、時間があるときに試してみたい。
1 5月

「ITエンジニアが芭蕉と学ぶ英語構文」の第3、4回

連載記事「ITエンジニアが芭蕉と学ぶ英語構文」の第3、4回が公開されています。
どちらも「可能」を示す表現です。

【第3回】可能(3)と旅立
https://globalization.co.jp/english-with-basho/03/

取り上げている構文:[無生物主語] make it [形容詞] (for [人]) to [動詞].

【第4回】可能(4)と草加
https://globalization.co.jp/english-with-basho/04/

取り上げている構文:With [名詞], [人] can [動詞].

芭蕉たちは江戸を旅立ち、草加(埼玉県)まで来ています。
★最新著書★
アプリ翻訳実践入門 『アプリ翻訳実践入門』
筆者について
西野 竜太郎
(Ryutaro Nishino)

翻訳者。合同会社グローバリゼーションデザイン研究所・代表社員。日本翻訳連盟・理事。
プロフィールや連絡先などについてはこちらをご覧ください。
Twitterアカウント
RSS フィード
著書
ソフトウェアグローバリゼーション入門
インプレス刊
『ソフトウェアグローバリゼーション入門』

達人出版会刊
『ソフトウェア・グローバリゼーション入門』


英語語源が魔術に変わる世界では
『英語語源が魔術に変わる世界では』


現場で困らない! ITエンジニアのための英語リーディング
『IT英語リーディング』


アプリケーションをつくる英語
紙版
『アプリケーションをつくる英語』

電子版
『アプリケーションをつくる英語』
第4回ブクログ大賞受賞】