rnishino

IT翻訳者Blog

翻訳、英語、ローカリゼーション、インターナショナリゼーションなどについて書いています。

8 5月

個人でもトレーニングできそうなNMTシステム

マイクロソフトが提供する機械翻訳サービス「Microsoft Translator」が更新された。大きな改善の1つとして、ニューラルMTをカスタマイズできる機能が追加されている。

Customized neural machine translation with Microsoft Translator
https://www.microsoft.com/en-us/research/blog/customized-neural-machine-translation-microsoft-translator/

記事を読むと、マイクロソフトの汎用MTシステムに対し、ユーザーが対訳文を追加することで、システムをトレーニングしてカスタマイズできるようだ。自分の専門分野や社内文書でトレーニングすることで、その分野により適合した訳文が出力されるようになる。
ただし、最低でも2,000以上の対訳文セットが必要とある。

以下の図を見ると、対訳を10,000(Very small)、10,000〜50,000(Small)、50,000〜10,000(Medium)、または100,000+(Large)追加してBLEU値を計算しているが、SmallやMedium程度でもそこそこの改善が見られるようだ。

Build_Table
引用元:https://www.microsoft.com/en-us/research/blog/customized-neural-machine-translation-microsoft-translator/

しかし、私がこの記事を読んで驚いたのはこの点である:
…, the computing power necessary to custom train represents less than 1% of the GPU computing power necessary if training were to start from a blank slate model.

なんと、ゼロからトレーニングする場合に比べ、GPU使用は1%未満で済むようだ。
実のところ、自分でトレーニングして自分(自社)用NMTシステムを作ることは可能である。たとえばOpenNMTのようなオープンソースのNMTソフトウェアも無料で入手できる。
ところが、GPUというハードウェアは数十万円もして高価な上、トレーニングにかなりの時間(数日では済まない)がかかる。

これは一見、地味なニュースに思えるかもしれないが、翻訳会社の視点からすると実はかなり大きなニュースではないだろうか。
数万程度の対訳セットなら中小規模の翻訳会社、場合によっては個人翻訳者でも準備できる。
自分の専門分野で訳してきた対訳の蓄積があれば、自分用のNMTシステムを簡単に構築できそうだ(もちろん法的側面のクリアが必要かもしれないが)。
これまでNMT導入に遅れたり、予算がなかったりした翻訳会社も手が届く。

なお、通常はトレーニング時に、対訳は1文ずつセットにしておかなければならない。しかしマイクロソフトのは文章に自動的にアラインメント(1文ずつのセットに揃えること)をかけてくれるようだ。100%完璧ではないかもしれないが、これで中小企業や個人はさらに楽になる。

OpenNMTは手間がかかるので試したことはなかったが、こちらはハードルがさらに低そうなので、時間があるときに試してみたい。
1 5月

「ITエンジニアが芭蕉と学ぶ英語構文」の第3、4回

連載記事「ITエンジニアが芭蕉と学ぶ英語構文」の第3、4回が公開されています。
どちらも「可能」を示す表現です。

【第3回】可能(3)と旅立
https://globalization.co.jp/english-with-basho/03/

取り上げている構文:[無生物主語] make it [形容詞] (for [人]) to [動詞].

【第4回】可能(4)と草加
https://globalization.co.jp/english-with-basho/04/

取り上げている構文:With [名詞], [人] can [動詞].

芭蕉たちは江戸を旅立ち、草加(埼玉県)まで来ています。
23 4月

ヨーロッパ翻訳業界調査2018年版を読む

ヨーロッパ翻訳業界調査の2018年版が4/21に出たようです。
調査協力しているGALAのサイトなどからPDFファイルを取得できます。

2018 Language Industry Survey -- Expectations and Concerns of the European Language Industry
http://www.gala-global.org/sites/default/files/uploads/pdfs/2018%20Language%20Industry%20Survey%20Report.pdf

ヨーロッパは翻訳市場としては北米やアジアよりも大きく、日本にはない取り組みもしているので、参考になります。
以下、調査結果で個人的に気になった点をいくつか挙げてみます。

◆単価は改善傾向

単価は2016年あたりの予測や実績と比べると、改善傾向のようです。
2018年は、翻訳会社(LSC)も個人もさらに高くなると予想しています。




◆翻訳会社でMTPEが増えそう



翻訳会社では、40%が外注(Outsourcing)を始めたい/増やしたいようです。さらにそれよりもMTPEが高く、グラフでは70%近くになっています。
一方で、クラウドソーシングとオフショアは低いままです。
このグラフは数字が独特で、「始めたい x 2 + 増やしたい - 止めたい x 2 - 減らしたい」で計算しています。

◆2割程度が機械翻訳を日常的に使う



企業も個人も、2割ほどが機械翻訳を日常的に使っているようです。
日常的ではないにせよ、企業も個人も4割以上が使っています。逆にまったく使わないのが、企業で3割、個人4割弱。
個人にも結構浸透しているようです。
しかも、以下の図にあるように、なんと過半数が無料のGoogle翻訳です。



◆翻訳修士号はあまり浸透せず

ヨーロッパには翻訳で修士号(EMT)が取れる学校があります。それを知っているか、知っている場合は採用時に考慮するかどうかという調査です。



約半分が知らず(No)、知っていて採用時に考慮するが13%。
認知度はごくわずかに上がっているようだが、採用時に考慮する割合は去年(20%)より減っているようだ…。

◆ポジティブ/ネガティブなトレンド



ポジティブな3大トレンドは、なし(None)が29%、需要増(Demand)が16%、分からない(Don't know)が9%と、何とも悲しい内容です。
一方、ネガティブな3大トレンドは具体的で、価格圧力(Price pressure)が38%、MTが21%、競合や競争(Competition)が8%です。


なお、2017年と2016年のときもブログ記事にしているので、過去の調査が気になればご覧ください。

・ヨーロッパ翻訳業界調査2017年版を読む
 http://blog.nishinos.com/archives/5211703.html
・ヨーロッパ翻訳業界調査2016年版を読む
 http://blog.nishinos.com/archives/5185598.html

以上です。
★6/22発売の翻訳書★
血と汗とピクセル 『血と汗とピクセル』
筆者について
西野 竜太郎
(Ryutaro Nishino)

翻訳者。合同会社グローバリゼーションデザイン研究所・代表社員。日本翻訳連盟・理事。
プロフィールや連絡先などについてはこちらをご覧ください。
Twitterアカウント
RSS フィード
著書
アプリ翻訳実践入門
『アプリ翻訳実践入門』


ソフトウェアグローバリゼーション入門
インプレス刊
『ソフトウェアグローバリゼーション入門』

達人出版会刊
『ソフトウェア・グローバリゼーション入門』


英語語源が魔術に変わる世界では
『英語語源が魔術に変わる世界では』


現場で困らない! ITエンジニアのための英語リーディング
『IT英語リーディング』


アプリケーションをつくる英語
紙版
『アプリケーションをつくる英語』

電子版
『アプリケーションをつくる英語』
第4回ブクログ大賞受賞】