rnishino

IT翻訳者Blog

翻訳、英語、ローカリゼーション、インターナショナリゼーションなどについて書いています。

翻訳/L10N

11 7月

無料オンライン講座「JTF日本語スタイルチェッカーの基本」を公開

私が代表を務めるグローバリゼーションデザイン研究所が、オンライン講座「JTF日本語スタイルチェッカーの基本」の提供を開始しました。受講は無料です。

本講座では「JTF日本語スタイルチェッカー」の基本的な使い方を解説しています。同チェッカーの使い方を習得し、日本語ドキュメントのスタイルの改善に役立ててください。

JTF日本語スタイルチェッカーの基本

以上です。
5 7月

翻訳業界の歴史を知る本

翻訳業界はそれほど規模が大きくないため業界史が必ずしも記録されておらず、口伝えに聞くしかないこともある。

柴田耕太郎氏の『翻訳家になろう!』(2012年、青弓社)を読んだら、翻訳業界の歴史について比較的詳しい記述があった。業界の人間にとっては貴重な資料だと思う。タイトルからこの内容は想像できなかった。

例えば「翻訳団体」という節(p.19)では、日本翻訳連盟(JTF)について以下のように書かれている。
 それでも徐々に経済回復への兆しが見え始めた1981年、日本翻訳連盟がひっそりと立ち上げられた。当初のメンバーは翻訳学校の日本翻訳学院(現・フェローアカデミー)と中小の翻訳会社を合わせて、十数社だった。<略>だが84年になると、少しずつ実績を積み上げていこうと考える企業と、実力をつけるにはまず社会的な認知が必要と考える企業が対立し、後者のメンバーは同会を脱退して新たに日本翻訳協会を設立した。

日本翻訳協会(JTA)の存在は知っていたが、もともと一つだったことは初耳だった。ほかにもさまざまな翻訳会社の歴史が紹介されていて、初めて知る事実も多かった。



また、昨今はISO 17100に関連して、翻訳が専攻できる大学院が話題に出ることがある。

実は日本でも2000年代半ばに「日本翻訳大学院大学」という専門職大学院が検討された(文科省サイト)。これが結局ダメになったことは聞いていたものの、その理由までは知らなかった。しかし同書には詳しい経緯が記されていた。

それによると、大学院の設置者である「栄光ゼミナール」から柴田氏が要請を受け、申請書を書いて文科省に提出したが、それに対して修正意見が出たらしい。柴田氏は反論して再提出しようと思ったものの、当の栄光ゼミナールが申請を取り下げてしまったということのようだ。同書にはその申請書の内容も掲載されている。

それから約10年経った現在、翻訳が専攻できる大学院への期待が高まっているので、この資料は貴重だと感じる。



ちなみにGoogleブックスから一部内容が読める(こちら)ので、興味のある方は試しに閲覧してから購入すればよいだろう。
14 6月

日本翻訳連盟(JTF)の理事に就任

先日(6/7)、日本翻訳連盟(JTF)の総会で承認していただき、理事に就任しました。

JTFは翻訳会社と個人翻訳者の両者が参加している翻訳業界団体です。
私は「産業翻訳は、翻訳者による実作業だけでは完結せず、原文が書かれるところから訳文が使われるところまでのプロセス全体を対象にしなければならない」と考えています。そのため、両者が参加するJTFは大きな役割を果たすはずです。

理事としては特に「翻訳品質」に取り組みたいと思っています。
機械翻訳の精度が向上したとされている現在、「何をもって良いとするのか?」という品質基準の確立は翻訳業界にとって重要です。きちんとした品質基準がないと、翻訳成果物は一緒くたにされてしまう可能性があります。何とか日本語になっている程度の訳文も、時間をかけて丁寧に作った訳文も、十把ひとからげです(※)。
これは翻訳業界にとって悲しい事態ですが、顧客側にとっても不便が生じます。例えばお金がかかっても優れた翻訳が欲しいという場面で、選択肢を見極める手段がないのです。要するに品質基準がないと、翻訳業界自身も顧客も困るのではないかと感じます。

JTFでは今年度から「翻訳品質委員会」が始まりました。私も一委員として参加しています。
「標準スタイルガイド検討委員会」からの改称ですが、扱う範囲は広くなっています。翻訳品質の要素としては、スタイルのほかに、例えば「用語」や「流暢さ」といった要素があります。こういった品質全体を視野に入れるつもりです。

翻訳品質委員会としては、まず翻訳品質のガイドラインの策定に取り組む予定です。
ガイドラインといっても、業界全体で均一の品質を目指そうというわけではありません。何かしら「目安」や「基準」を持とうという程度です。
例えば、プロの翻訳サービスをまったく使ったことのない新規顧客がいた場合、どの程度やってもらえるのかという目安がないと、怖くて発注できないかもしれません。「無料の機械翻訳と何が違うの?」という質問にも明確に答えられません。
また業界で品質の目安があると、例えば翻訳会社Aは「うちは目安に加え、こういうことをしています」、翻訳会社Bは「うちは目安にこれとこれを追加しているので、その分料金が高いです」といったサービス展開ができます。要するに、差別化の基準として使えるわけです。
このように、ガイドラインがあると、業界全体として新規顧客を獲得したり、各翻訳会社が自社の特徴を出す手段となったりするのではと期待しています。結果として翻訳業界が活性化すればうれしいことです。
ただし、この辺りは個人的なイメージで、まだ委員会として何かを決めたわけではありません。

とりあえずの理事任期は1年ですが、上記の通りまずは「翻訳品質」について取り組みたいと考えています。


※ ちなみにISO 17100は翻訳の「サービス」が対象であり、翻訳成果物(プロダクト)そのものの品質を扱っているわけではありません。翻訳成果物については、今年からISO 21999として議論が始まります。
8 6月

流暢だが訳抜けが発生するニューラル機械翻訳

昨日、2017年度の日本翻訳連盟(JTF)の総会で、AAMT会長の中岩氏が基調講演をされた。そこで興味深い最新論文を紹介してもらった。
従来の統計的機械翻訳(そのうちPBMT)と、最新のニューラル機械翻訳(NMT)との比較をした論文で、どの種類のエラーが多く出るのかを調べたものだ。

 Fine-Grained Human Evaluation of Neural Versus Phrase-Based Machine Translation
 https://ufal.mff.cuni.cz/pbml/108/art-klubicka-toral-sanchez-cartagena.pdf
 Klubička, Filip, Toral, Antonio, M. Sanchez-Cartagenac, Victor著
 (The Prague Bulletin of Mathematical Linguistics. 2017, no. 108, p. 121–132)

英語からクロアチア語への翻訳について、MQMのエラー分類のうち「正確さ」(Accuracy)と「流暢さ」(Fluency)を使っている(ちなみにAccuracyは機械翻訳分野におけるAdequacyに相当)。
ただし、クロアチア語の特質に合わせて一致(Agreement)などの項目を独自に追加しているようだ。

結果は以下のようになっている。上記論文の表4を引用する。



一番左の列はエラー・タイプを示していて、「Accuracy」と「Fluency」という大きなレベルがあり、その下にいくつ項目がある。
またその右に機械翻訳システムが並んでいる。「PBMT」、「Factored」(Factored PBMTというPBMTの一種)、一番右が「NMT」である。
緑色のセルは、そのすぐ左のセルよりも良くなった(エラーが少ない)ことを示している。赤色のセルは、その逆である(※)。

一見して分かるように、流暢さ(Fluency)は全体的にNMTで向上している。
一方、NMTには赤いセルが1つある。正確さにおける「Omission」である。これは「訳抜け」のことだ。
これまで「NMTの訳文は読みやすくなったが、訳抜けが発生する」という指摘はなされてきた。Googleでも自社のNMTで発生することを認めている。
これが印象ではなく、きちんとした実証的研究として示されたことの意義はあると思う。私は当分野の専門家ではないので不勉強の可能性があるが、このような分かりやすい図表は初めて見た。
同研究は英語=クロアチア語間なので、日本語訳の評価もぜひしてもらいたいところだ。


※ アスタリスク(*)は統計的な有意差を示している(*はp<0.05、**はp<0.0001とのこと)。
3 6月

ISO 17100における「ポストエディットではないもの」の基準

前の投稿との関連です)

ISO 17100で力量を満たす翻訳者と認定されるためには、「翻訳」の経験が必要となる。
機械翻訳(MT)の出力を編集する「ポストエディット」がその経験にカウントされるかどうかで、議論が発生している。簡単に経緯をまとめると、以下の通りとなる。

・第三者機関として登録先となる日本規格協会(JSA)は、5/31の翻訳者登録制度説明会における質疑応答で、MT出力を使うことは経験にカウントしてよい旨の回答をした。
(ただし回答に「ポストエディット」という言葉そのものはなかったように記憶している)

・これに対し、ISO 17100はポストエディットを範囲外としているため、矛盾しているという内容の指摘がなされた。確かに、以下のような記載がある。
The use of raw output from machine translation plus post-editing is outside the scope of ISO 17100:2015.
引用元:https://www.iso.org/standard/59149.html


・ところが、ISO 17100で「post-edit」の用語解説の注記を見ると、「翻訳支援ツール(CAT)上に提示されるMT出力を翻訳者が見て使うことはpost-editに該当しない」としている。以下の部分だ(下線は西野)。

2.2.4
post-edit
edit and correct machine translation output (2.2.3)

Note 1 to entry: This definition means that the post-editor will edit output automatically generated by a machine translation engine. It does not refer to a situation where a translator sees and uses a suggestion from a machine translation engine within a CAT (computer-aided translation) tool.

引用元:https://www.iso.org/obp/ui/#iso:std:iso:17100:ed-1:v1:en


JSAの回答がこの注記のことを指していると理解すると、矛盾は無いように思える。



では、これがポストエディットにならないとする理由は何なのだろうか?
私は前の投稿で、MT出力の「訳文のみ」を見て編集するか「対訳」を見て編集するかが分別基準であると考えた。
CATツールは翻訳時に使うものであり、対訳で作業することが普通だ。また、原文と訳文の両方を見比べて判断を下すこと(例:「このMT出力は原文の意味を反映していて無編集で使える」という判断)は、「翻訳」作業の一種と捉えてよいと考えたからだ。
このように、ポストエディット時に扱うのが「訳文のみ」か「対訳」かを分別基準として考えれば、すっきりと説明できると思った。



しかし、「訳文のみ」か「対訳」かという基準を持ち込まなくても、文言通りに解釈してよいのでは、という指摘を同業者から受けた。CATツール上に提示されるMT出力を使うならポストエディットではない、ということだ。
もしMT出力がまず作業前提として存在し、それを編集するならば、ポストエディットである。
一方、翻訳作業中にCATツール上にMT出力が訳文の一候補として提示されるのならば、ポストエディットではない。翻訳者は自分の頭で訳してもよいし、翻訳メモリーから既存訳を取得してもよいし、当該MT出力を利用してもよい。
要するに、MT出力が作業の「前提」なのか、単に「一候補」なのか、が分別基準となる。

確かにこの基準を用いれば私の分別基準は不要だ。
しかし問題は、その見分けが難しいという点だろう。
例えば翻訳者がCATツールで、セグメントを開くたびに毎回MT出力を自動入力させるような作業手順を採用していたとする。このケースではポストエディットと何ら違いはないように思える。



このように、ISO 17100における「ポストエディットではないもの」を判断する基準は、あるにしても適用に困難が伴うように思える。
規格といっても結局人間が作るものであるし、発案時と現在とでは状況が違う(例:MTの進歩や普及)だろうから、将来的な改訂を待つしかないのかもしれない。

ただし少なくとも、翻訳者がCATツールを使って経験を積んだ際、そこにMT出力が少し入っていたという理由でアウト(ISOの翻訳者として不適合)という判定が下されることはない、とは言えそうだ。
筆者について
西野 竜太郎
(Ryutaro Nishino)

翻訳者。合同会社グローバリゼーションデザイン研究所・代表社員。日本翻訳連盟・理事。
プロフィールや連絡先などについては会社のウェブサイトをご覧ください。
Twitterアカウント
著書
現場で困らない! ITエンジニアのための英語リーディング
『IT英語リーディング』


ソフトウェア・グローバリゼーション入門:I18NとL10Nを理解する
『ソフトウェア・グローバリゼーション入門』


アプリケーションをつくる英語
紙版
『アプリケーションをつくる英語』

電子版
『アプリケーションをつくる英語』
第4回ブクログ大賞受賞】