rnishino

IT翻訳者Blog

翻訳、英語、ローカリゼーション、インターナショナリゼーションなどについて書いています。

21 5月

最新の「Microsoft Writing Style Guide」が無料で公開

つい最近知ったのですが、2018年2月にマイクロソフトが英語スタイルガイド「Microsoft Writing Style Guide」を無料公開していたようです。

Microsoft Writing Style Guide
https://docs.microsoft.com/ja-jp/style-guide/welcome/

ms-styleguide

これまでIT分野の英語スタイルガイドとして重要な位置を占めてきた『Microsoft Manual of Style』の後継となるようです。
The Microsoft Writing Style Guide replaces the Microsoft Manual of Style, a respected source of editorial guidance for the tech community for more than 20 years.

従来の『Microsoft Manual of Style』は2012年に第4版が出たので、6年ぶりの更新となるようです。
また同書は有料で販売されていましたが、「Microsoft Writing Style Guide」はウェブ上で無料公開となりました。

古い『Microsoft Manual of Style』では、全般的なスタイル解説に加え、個々の単語の使い方を解説するという特徴を持っていました。
新しい「Microsoft Writing Style Guide」も同様に、スタイル全般 + 個々の単語の解説という構成になっています。
たとえば「abort」という単語についてはこう解説があります。
Don't use abort in content or user experiences for a general audience. If abort appears in a UI that you can't edit, use an alternative term to describe the customer action.

要するに、abortという単語は一般向けには使わず、UIに出てきたら言い換えよということです。言い換え候補として以下が挙がっています。
  • End: use for communications and network connections.

  • Close: use for apps and programs.

  • Stop: use for hardware operations.

  • Cancel: use for requests and processes.

このように、1つの単語についてもかなり解説が詳しいので、英語を書くのに悩んでいる日本人にとっても大いに参考になるはずです。



昨年、Googleが開発者向け文書のスタイルガイドを公開しました。
これはこれで簡潔にまとまっていて便利なのですが、やはり英語ライティングのリソースに関してはマイクロソフトに一日の長があります。
「Microsoft Writing Style Guide」は無料でアクセスできるので、英語を書く際に活用してみてはいかがでしょうか。

20 5月

「ITエンジニアが芭蕉と学ぶ英語構文」の第5〜6回

連載記事「ITエンジニアが芭蕉と学ぶ英語構文」の第5〜6回が公開されています。

basho-title

芭蕉たちは栃木市の「室の八島」を経て、日光東照宮を参詣しています。

【第5回】可能(5)と室の八島
https://globalization.co.jp/english-with-basho/05/

取り上げている英語構文: [無生物主語] [be動詞] available (at/in/for [場所/物]).

【第6回】不可能(1)と日光
https://globalization.co.jp/english-with-basho/06/

取り上げている英語構文: [無生物主語] fail to [動詞].


以上です。
8 5月

個人でもトレーニングできそうなNMTシステム

マイクロソフトが提供する機械翻訳サービス「Microsoft Translator」が更新された。大きな改善の1つとして、ニューラルMTをカスタマイズできる機能が追加されている。

Customized neural machine translation with Microsoft Translator
https://www.microsoft.com/en-us/research/blog/customized-neural-machine-translation-microsoft-translator/

記事を読むと、マイクロソフトの汎用MTシステムに対し、ユーザーが対訳文を追加することで、システムをトレーニングしてカスタマイズできるようだ。自分の専門分野や社内文書でトレーニングすることで、その分野により適合した訳文が出力されるようになる。
ただし、最低でも2,000以上の対訳文セットが必要とある。

以下の図を見ると、対訳を10,000(Very small)、10,000〜50,000(Small)、50,000〜10,000(Medium)、または100,000+(Large)追加してBLEU値を計算しているが、SmallやMedium程度でもそこそこの改善が見られるようだ。

Build_Table
引用元:https://www.microsoft.com/en-us/research/blog/customized-neural-machine-translation-microsoft-translator/

しかし、私がこの記事を読んで驚いたのはこの点である:
…, the computing power necessary to custom train represents less than 1% of the GPU computing power necessary if training were to start from a blank slate model.

なんと、ゼロからトレーニングする場合に比べ、GPU使用は1%未満で済むようだ。
実のところ、自分でトレーニングして自分(自社)用NMTシステムを作ることは可能である。たとえばOpenNMTのようなオープンソースのNMTソフトウェアも無料で入手できる。
ところが、GPUというハードウェアは数十万円もして高価な上、トレーニングにかなりの時間(数日では済まない)がかかる。

これは一見、地味なニュースに思えるかもしれないが、翻訳会社の視点からすると実はかなり大きなニュースではないだろうか。
数万程度の対訳セットなら中小規模の翻訳会社、場合によっては個人翻訳者でも準備できる。
自分の専門分野で訳してきた対訳の蓄積があれば、自分用のNMTシステムを簡単に構築できそうだ(もちろん法的側面のクリアが必要かもしれないが)。
これまでNMT導入に遅れたり、予算がなかったりした翻訳会社も手が届く。

なお、通常はトレーニング時に、対訳は1文ずつセットにしておかなければならない。しかしマイクロソフトのは文章に自動的にアラインメント(1文ずつのセットに揃えること)をかけてくれるようだ。100%完璧ではないかもしれないが、これで中小企業や個人はさらに楽になる。

OpenNMTは手間がかかるので試したことはなかったが、こちらはハードルがさらに低そうなので、時間があるときに試してみたい。
著書
ソフトウェアグローバリゼーション入門
インプレス刊
『ソフトウェアグローバリゼーション入門』

達人出版会刊
『ソフトウェア・グローバリゼーション入門』


英語語源が魔術に変わる世界では
『英語語源が魔術に変わる世界では』


現場で困らない! ITエンジニアのための英語リーディング
『IT英語リーディング』


アプリケーションをつくる英語
紙版
『アプリケーションをつくる英語』

電子版
『アプリケーションをつくる英語』
第4回ブクログ大賞受賞】