rnishino

IT翻訳者Blog

翻訳、英語、ローカリゼーション、インターナショナリゼーションなどについて書いています。

8 5月

個人でもトレーニングできそうなNMTシステム

マイクロソフトが提供する機械翻訳サービス「Microsoft Translator」が更新された。大きな改善の1つとして、ニューラルMTをカスタマイズできる機能が追加されている。

Customized neural machine translation with Microsoft Translator
https://www.microsoft.com/en-us/research/blog/customized-neural-machine-translation-microsoft-translator/

記事を読むと、マイクロソフトの汎用MTシステムに対し、ユーザーが対訳文を追加することで、システムをトレーニングしてカスタマイズできるようだ。自分の専門分野や社内文書でトレーニングすることで、その分野により適合した訳文が出力されるようになる。
ただし、最低でも2,000以上の対訳文セットが必要とある。

以下の図を見ると、対訳を10,000(Very small)、10,000〜50,000(Small)、50,000〜10,000(Medium)、または100,000+(Large)追加してBLEU値を計算しているが、SmallやMedium程度でもそこそこの改善が見られるようだ。

Build_Table
引用元:https://www.microsoft.com/en-us/research/blog/customized-neural-machine-translation-microsoft-translator/

しかし、私がこの記事を読んで驚いたのはこの点である:
…, the computing power necessary to custom train represents less than 1% of the GPU computing power necessary if training were to start from a blank slate model.

なんと、ゼロからトレーニングする場合に比べ、GPU使用は1%未満で済むようだ。
実のところ、自分でトレーニングして自分(自社)用NMTシステムを作ることは可能である。たとえばOpenNMTのようなオープンソースのNMTソフトウェアも無料で入手できる。
ところが、GPUというハードウェアは数十万円もして高価な上、トレーニングにかなりの時間(数日では済まない)がかかる。

これは一見、地味なニュースに思えるかもしれないが、翻訳会社の視点からすると実はかなり大きなニュースではないだろうか。
数万程度の対訳セットなら中小規模の翻訳会社、場合によっては個人翻訳者でも準備できる。
自分の専門分野で訳してきた対訳の蓄積があれば、自分用のNMTシステムを簡単に構築できそうだ(もちろん法的側面のクリアが必要かもしれないが)。
これまでNMT導入に遅れたり、予算がなかったりした翻訳会社も手が届く。

なお、通常はトレーニング時に、対訳は1文ずつセットにしておかなければならない。しかしマイクロソフトのは文章に自動的にアラインメント(1文ずつのセットに揃えること)をかけてくれるようだ。100%完璧ではないかもしれないが、これで中小企業や個人はさらに楽になる。

OpenNMTは手間がかかるので試したことはなかったが、こちらはハードルがさらに低そうなので、時間があるときに試してみたい。
1 5月

「ITエンジニアが芭蕉と学ぶ英語構文」の第3、4回

連載記事「ITエンジニアが芭蕉と学ぶ英語構文」の第3、4回が公開されています。
どちらも「可能」を示す表現です。

【第3回】可能(3)と旅立
https://globalization.co.jp/english-with-basho/03/

取り上げている構文:[無生物主語] make it [形容詞] (for [人]) to [動詞].

【第4回】可能(4)と草加
https://globalization.co.jp/english-with-basho/04/

取り上げている構文:With [名詞], [人] can [動詞].

芭蕉たちは江戸を旅立ち、草加(埼玉県)まで来ています。
23 4月

ヨーロッパ翻訳業界調査2018年版を読む

ヨーロッパ翻訳業界調査の2018年版が4/21に出たようです。
調査協力しているGALAのサイトなどからPDFファイルを取得できます。

2018 Language Industry Survey -- Expectations and Concerns of the European Language Industry
http://www.gala-global.org/sites/default/files/uploads/pdfs/2018%20Language%20Industry%20Survey%20Report.pdf

ヨーロッパは翻訳市場としては北米やアジアよりも大きく、日本にはない取り組みもしているので、参考になります。
以下、調査結果で個人的に気になった点をいくつか挙げてみます。

◆単価は改善傾向

単価は2016年あたりの予測や実績と比べると、改善傾向のようです。
2018年は、翻訳会社(LSC)も個人もさらに高くなると予想しています。




◆翻訳会社でMTPEが増えそう



翻訳会社では、40%が外注(Outsourcing)を始めたい/増やしたいようです。さらにそれよりもMTPEが高く、グラフでは70%近くになっています。
一方で、クラウドソーシングとオフショアは低いままです。
このグラフは数字が独特で、「始めたい x 2 + 増やしたい - 止めたい x 2 - 減らしたい」で計算しています。

◆2割程度が機械翻訳を日常的に使う



企業も個人も、2割ほどが機械翻訳を日常的に使っているようです。
日常的ではないにせよ、企業も個人も4割以上が使っています。逆にまったく使わないのが、企業で3割、個人4割弱。
個人にも結構浸透しているようです。
しかも、以下の図にあるように、なんと過半数が無料のGoogle翻訳です。



◆翻訳修士号はあまり浸透せず

ヨーロッパには翻訳で修士号(EMT)が取れる学校があります。それを知っているか、知っている場合は採用時に考慮するかどうかという調査です。



約半分が知らず(No)、知っていて採用時に考慮するが13%。
認知度はごくわずかに上がっているようだが、採用時に考慮する割合は去年(20%)より減っているようだ…。

◆ポジティブ/ネガティブなトレンド



ポジティブな3大トレンドは、なし(None)が29%、需要増(Demand)が16%、分からない(Don't know)が9%と、何とも悲しい内容です。
一方、ネガティブな3大トレンドは具体的で、価格圧力(Price pressure)が38%、MTが21%、競合や競争(Competition)が8%です。


なお、2017年と2016年のときもブログ記事にしているので、過去の調査が気になればご覧ください。

・ヨーロッパ翻訳業界調査2017年版を読む
 http://blog.nishinos.com/archives/5211703.html
・ヨーロッパ翻訳業界調査2016年版を読む
 http://blog.nishinos.com/archives/5185598.html

以上です。
著書
ソフトウェアグローバリゼーション入門
インプレス刊
『ソフトウェアグローバリゼーション入門』

達人出版会刊
『ソフトウェア・グローバリゼーション入門』


英語語源が魔術に変わる世界では
『英語語源が魔術に変わる世界では』


現場で困らない! ITエンジニアのための英語リーディング
『IT英語リーディング』


アプリケーションをつくる英語
紙版
『アプリケーションをつくる英語』

電子版
『アプリケーションをつくる英語』
第4回ブクログ大賞受賞】