IT翻訳者Blog

翻訳、英語、ローカリゼーション、インターナショナリゼーションなどについて書いています。

カテゴリ: 翻訳/L10N

日本翻訳連盟(JTF)が印刷冊子として発行していた「JTFジャーナル」は、2021年1月からウェブに移行しました。

JTFジャーナル WEB版
https://webjournal.jtf.jp/



これに伴い、河野弘毅さんから私が編集長を引き継ぐことになりました。

印刷版はじっくり読める記事が多数掲載されている点が良かったのですが、2か月に1度の発行だったため、速報性のあるニュースを出しにくいという弱点もありました。そこでウェブ版では、じっくり読める記事も掲載しつつ、翻訳業界の最新ニュースを中心に取り上げる予定です。



じっくり読める記事としては、まず「連載」があります。リンギストに焦点を当てたインタビュー記事連載「リンギストの仕事」と、機械翻訳の最新動向を紹介して考察も加える連載「Transformed」です。

ほかに「特集」として、翻訳祭やJTF主催セミナーなどの報告を掲載します。

また、JTF会員自身で投稿できる機能も追加しました。法人会員はニュースリリース(プレスリリース)、個人会員は(自分で主催する)勉強会情報です。



上記のように、ウェブ版JTFジャーナルで中心となるのは、翻訳業界の最新ニュースです。

大きめのニュースは個別記事としますが、小さめあるいは参考までのニュースは週に1度「週間ニュースまとめ」という形で掲載します。

情報提供のフォームも設置しています。取り上げるべきだと思われる業界ニュースやイベントがあれば、フォームからぜひお知らせください。
このエントリーをはてなブックマークに追加

ニューラル機械翻訳(NMT)のシステムは、使うだけならGoogleなどのものを無料で利用できる。しかしNMTシステムを作るとなると、対訳データが大量(数十〜数百万ペア)に必要な上に、モデルをトレーニングさせるためのGPUが高価(数十万円)であるため、個人はもちろん、中小の翻訳会社でもハードルは高かった。

ところがここ数年くらいで「アダプテーション」と呼ばれる仕組みが広がりつつある。これは、汎用モデルに対し、特定分野の対訳データで追加トレーニングすることを指す。そのため当該分野に強いNMTシステムを構築できる。アダプテーション対応のサービスでは、基本となる汎用対訳データが用意されているので、自分で専門分野の対訳データを「ある程度」準備すればよいだけである。特定の分野や言語で質の高い対訳データを持つ中小翻訳会社や個人は、分野に特化したNMTサービスを有料で提供したり、自社の翻訳ビジネスを拡張したりできるかもしれない。

「ある程度」と書いたが、どのくらいの対訳データ(ペア数)があれば十分かの判断はなかなか難しい。後述するGlobaleseでは1.5万が最小、10万以上を推奨としている(参考)。一方でマイクロソフトの記事を見ると、特定分野(office)において1.5万から10万に増やしてもさほど変わっているようにも思えない。だから最初は「数万」くらいを用意し、様子を見つつ徐々に増やすという方法が良いのだろうか。



アダプテーションに対応したクラウド・サービスはいくつかある。用語登録など機能の有無に違いはあるが、私がまず気になったのはトレーニングのコストだったので、その点を中心に見てみる。

・Google AutoML Translation
https://cloud.google.com/translate/automl/docs

トレーニングは1時間あたりが45米ドルで、上限は300ドルである。1〜10万ペアで4〜5.5時間とあるので、仮に5時間トレーニングすると、225ドル(約2.5万円)かかる。
料金表はこちら

・Microsoft Translator
https://azure.microsoft.com/ja-jp/services/cognitive-services/translator/

100万文字あたり4,480円(毎月200万文字までは無料)で、1回のトレーニングあたりの上限が33,600円である。
料金表はこちら

・IBM Language Translator
https://cloud.ibm.com/docs/language-translator

トレーニング自体は無料のようだが、「拡張」プラン以上が必要で、MT出力には費用がかかる。
料金表はこちら

・Globalese
https://www.globalese-mt.com/

クラウドは月50ユーロ(約6,000円)の固定。
料金表はこちら



GoogleやMicrosoftのように、1回トレーニングするたびに2〜3万円かかるのは、個人や中小企業にはなかなか厳しい。そう考えるとIBMやGlobaleseのトレーニング無料のサービスに目が行く。

しかし実はコストがかかるのはトレーニングだけでない。機械翻訳の出力(文字あたり)にも、サーバー維持にもお金がかかる。結局、トータルで計算しないと……と思っていたとき、すでに計算していた人がいた! 以下は2019年時点のデータだが、非常にありがたい。スライドの前の方には各サービスの機能も掲載されている。





上記の表を参考にすれば、アダプテーションしたNMTシステムを維持するトータルの概算コストは何とか計算できそうだ。

しかし、もしユーザーにそのNMTシステムを有料で使ってもらうビジネスを始めようとしたら、課金システムを別途作らなければならない。筆者のようにITを専門にしている翻訳者であっても、課金システムを用意するのは簡単ではない……と思っていたところ、何とその部分を面倒を見てくれるサービスがあった。

・SYSTRAN Model Studio
https://www.systransoft.com/translation-products/systran-model-studio/

簡単に言うと、自分の対訳データでモデルをトレーニングし、それをマーケットプレイスに公開して有料で使ってもらうという仕組みらしい。確かに、よく考えたらこのようにモデルを仲介するプラットフォーム・ビジネスは成立しそうだ。ただしモデル提供者の取り分がいくらかはすぐに分からなかった。

トレーニング済みモデルのカタログを見ると、すでに256個(2021-01-05時点)が公開されている。多くはSYSTRAN提供だが、それ以外もある。日本語では、日⇔中の医療機器文書から作られたモデルがある(ISE提供)。



上記のような便利なサービスがあったとしても、まずそれ以前に準備すべきは対訳データである。ペアは「数万」は必要そうだと上で書いた。

実は先日、自分の専門分野(IT)で対訳ペアをウェブ上で集めてみた。丸々1日かけて集まったのは3,000弱だった。毎日そのペースで順調に集められれば、2週間くらいで数万にはなりそうではある。しかし、ウェブ上のデータを著作権法上は問題なく入手できたとしても、利用規約で用途外利用が禁止されていることもある。全くのゼロから集めるとしたら、数万でも容易ではないかもしれない。やはり対訳データ所有者と交渉できる企業が有利だろう。

個人や中小企業でNMTサービスを提供する便利な仕組みは現れつつあるが、やはり越えるべきハードルはいくつもありそうだ。
このエントリーをはてなブックマークに追加

ここ何年かの間、「翻訳の品質とは何か?」、「それをどう測定できるのか?」という問題に取り組んできた。一応の結論として「JTF翻訳品質評価ガイドライン」という形で公開できた。

もちろん一直線に結論に到達したわけではなく、悩ましい問題もあった。従来、業界では「翻訳品質はエラーの数で測る」という手法が広く用いられてきた。たとえば用語集違反が1つあれば、それに深刻度を掛けて点数にする。点数を合計し、低ければ高品質とする考え方だ。出るのは数字だし、他と比較も可能なので、客観性のある方法だと考えられている。

しかし、そもそも翻訳の良し悪しをエラー数だけで測ってよいのかという疑問はあった(記事)。たとえば広告の場合、用語集やスタイルガイドに違反した(=エラー)としても、最終読者の心を動かすような訳文に仕上げたほうが、発注者も翻訳者もうれしいはずだ。そのため上記ガイドラインでは「適切な場面では、主観評価なども組み入れて評価しましょう」といった主張になっている。

◆ 代用特性とは

何かの品質特性(上記なら翻訳の良し悪し)を直接的に測るのが難しい場合、代わりに別のもの(上記ならエラー数)で測る。品質管理分野ではこの別のものを「代用特性」と呼ぶ。たとえばQC検定4級のテキストにはこう説明されている。
要求される品質特性を直接測定することが困難な場合、同等又は近似の評価として用いる他の品質特性。

「品質管理検定(QC検定)4級の手引き Ver.3.1」p. 40(https://webdesk.jsa.or.jp/pdf/qc/md_4611.pdf


実はこの説明の末尾に重要な一文が書かれている。
代用特性は、要求される品質特性を直接測定しているわけではありません。したがって、要求される品質特性と代用特性との関係を十分に確認することが必要です。

要するに、本当に図りたい品質をその代用特性で測れているのか、その代用特性は妥当なのか、という疑問を常に持てという話である。また、単に測りやすいからという理由で、ある代用特性を利用するのも望ましくないだろう。

翻訳業界で代用特性が使われる場面は、上記のエラー数以外にもある。一例を挙げると「TOEICの点数で機械翻訳の質を測る」ケースである。詳しい測り方はこちらの記事で説明しているが、私も含めて多くの翻訳者は批判的に捉えている。品質特性(=翻訳の質)と代用特性(=TOEIC点数)との間に十分な関係がないのではということである(外国語ができるだけでは翻訳はできない)。

しかしながら、最初に挙げたエラー評価も、TOEIC点数による機械翻訳システム評価も、疑問を持つことなく使われることが多い。あるいは疑問を持ちつつも、仕方なく使っているのかもしれない。というのも数字で出すと比較が容易であるし、客観性があると思われて人を説得しやすいからである。このとき”客観性”という錦の御旗に隠されてしまうのが、上で説明した代用特性の妥当さである。

数字で測って比べるのは客観性があるのかもしれないが、その結果、本当に測りたいものが測れていないのであれば残念なことである。



よく考えてみると、人生や社会生活の中でも、代用特性の妥当さをよく考えないまま使ってしまい、結果的に不幸になるケースはありそうだ。

たとえば、学校の良し悪しに「偏差値」を、就職先企業の良し悪しに「年収」を代用特性として使ってしまうような場合である。どちらも数字なので客観性があって説得力はありそうだし、ほかとの比較も簡単だ。そういった代用特性を何も考えずに使って入学先や就職先を判断してしまうと、人によっては悲しい境遇に陥ることになるだろう。



数字で測って比べるのは、客観性があり説得力もある。しかしその数字が代用特性である場合、真に測りたい品質特性との関係は十分なのか、妥当であるのかを常に意識しておきたいものである。


このエントリーをはてなブックマークに追加

2017年10月に、翻訳業界調査をしているNimdzi社のRenato Beninatto氏らが「The General Theory of the Translation Company」(翻訳会社の一般理論)という書籍を出した。当時(海外の)業界ではそこそこ話題になっていたが、やっと最近読み終わった。




名前の通り、同書では「翻訳会社」の機能や仕組みを解説している。1枚の図で表すとこうである(同書より引用)。



まず中央の黄色い部分が翻訳会社の中核機能(Core Functions)である。これには3つが挙げられている。

 ・ベンダー管理(Vendor Management)
  ※ここでベンダーとは発注先(フリーランス翻訳者や翻訳会社)
 ・プロジェクト管理(Project Management)
 ・営業(Sales)

また、その外側にあるのが支援活動(Support Activities)で、8つ挙げられている(図だとやや文字が読みにくい)。

 ・経営(Management)
 ・企業組織(Structure)
 ・企業文化(Culture)
 ・財務(Finance)
 ・施設(Facilities)
 ・人的資源(Human Resources)
 ・テクノロジー(Technology)
 ・言語品質保証(Language Quality Assurance)

一番外側にあるのは、市場に影響を与えるもの(Market Influencers)である。

 ・新規参入者(New Entrants)
 ・顧客(Customers)
 ・代替品(Substitutes)
 ・競合他社(Rivalry)
 ・供給業者(Suppliers)



翻訳会社の機能については、以前自分のブログ記事でもまとめたことがあった(同じ2017年の1月だった)。見出しだけまとめる。

 【クライアント側から見た機能】
  A. コーディネーション機能
  B. プロジェクト管理機能
  C. 品質保証機能
  D. 編集/校正機能

 【翻訳者側から見た機能】
  a. 営業機能
  b. 教育/サポート機能

こう見ると、Beninatto氏らの言う中核機能と支援活動に該当するものが含まれている。

 ・ベンダー管理 → A. コーディネーション機能
 ・プロジェクト管理 → B. プロジェクト管理機能
 ・テクノロジー → (一部)b. 教育/サポート機能
 ・言語品質保証 → C. 品質保証機能

一般的な企業でも必要な「企業文化」や「財務」などを除くと、翻訳会社特有の機能についてはかなり認識は一致しているように思える。



ただし「品質保証」については異論がある。

Beninatto氏らが品質保証を(中核機能ではなく)支援活動に入れているのは、品質保証が付加価値を生み出さないからというのが理由だ。どの会社でも「高品質」をうたうため、それは差別化要因にならない。例として配管工事が挙げられていた。配管工事を依頼したらきちんと直るのが当然であり、翻訳もそれと同じだという話らしい。

これは品質のうち「当たり前品質」しか見ていないのだと思う。当たり前品質とは「不充足だと不満、充足されて当たり前」(参考)という品質である。確かにそういう面もあるが、翻訳には「不充足でも仕方がない(不満には思わない)が、充足されれば満足」(参考)という「魅力品質」の面もある。たとえばゲームの翻訳が素晴らしく、世界観に引き込まれるようなケースだ。こういう翻訳は明らかに差別化要因になる。



しかし「当たり前品質」こそを品質とみなすのは、グローバルな翻訳ビジネスでは当然なのかもしれない。
同書では、翻訳業界を次のような階層構造として見ている。

(同書より引用)

つまり、一番上にクライアント(LSB)がおり、その下に多言語翻訳会社(MMLSPやMLSP)がいる。さらに下に各地域の多言語翻訳会社(RMLSP)、その下に単言語翻訳会社(SLSP)、そして翻訳実作業をするフリーランス翻訳者(CLP)がいる。

こういう階層構造を想定すれば、下から上まで一貫した品質の翻訳が求められる。ある意味、自動車のような工業製品に近い。用語集などで仕様をがっちり固め、それを守る。下流で部品を上流に納品し、それを組み立ててさらに上流に納品する。仕様を守ることで完成品の品質は安定する。だから多言語を扱う中で、ある言語だけ「魅力的品質」を備えていたら、むしろ品質管理に困る。安定した品質が求められる大量生産の工業製品においては、いち職人の名人芸は面倒を増やす。

翻訳の部品化は良い悪いという話ではなく、階層構造を持つグローバルな翻訳ビジネスを想定するのであれば、当たり前の現実なのかもしれない。
このエントリーをはてなブックマークに追加

毎年出されている「ヨーロッパ翻訳業界調査」の2020年版が公開されている。

EUROPEAN LANGUAGE INDUSTRY SURVEY 2020: BEFORE & AFTER COVID-19
http://fit-europe-rc.org/wp-content/uploads/2020/04/Final-webinar-presentation-1.pdf(PDFファイル)

例年とは違い、今回公開されているのは完全なレポートではなく、ウェビナーのスライドである。そのせいか、例年より情報量が少なく読みにくく感じる(なおウェビナー録画はこちらから閲覧できるらしい)。また新型コロナの影響に関する質問項目も多い。

★追記:こちらで完全なレポート(PDF)が公開された(6/12)

ここでは私が個人的に興味を持った点を取り上げてみたい。

▼個人翻訳者のストレス要因(p. 14)


支払いや単価(Pay/rates)は大きなストレス要因になっているが、技術変化(Technological change)はさほどストレスになっていないようだ。
MTを使う翻訳者も増えているはずだが、MT使用にストレスを感じている人はそこまで多くないのかもしれない(p. 16には35%がMTはストレスだと回答)。


▼個人翻訳者のTMやMTの使用状況(p. 15)


TM、自動QAツール、MTの使用状況のグラフである。
図に説明がないので見方がよくわからないが、パッと見で足すと100%くらいになるので、使っている人のみが回答しているのかもしれない。
意外に自動QAツールが普及しているという印象があった。


▼トレンド(p. 16)


個人も翻訳会社も、やはりMT(MTPE)が一番のトレンドのようだ。
左の図を見ると、翻訳会社よりむしろ個人がMTPEに関心を持っているのかもしれない。


▼翻訳修士号(EMT)の知名度(p. 18)


これは毎年調査されている項目である。
しかしここ5年間ずっと「知らない」(No)が約5割で、「知っていて採用時に考慮する」(Yes, take it into account)は1割程度である。要するに知名度も上がっていないし、採用に大きく有利になるわけではない。
これは、大学が業界のニーズに応えられていないということではないだろうか?
業界が求めるような教育を提供できていないため、知名度は上がらないし、知っていても採用時に考慮されない。

日本でもこのEMTコンピテンス枠組み(PDFリンク)を参照する大学があるようだ。しかしこの調査結果を見ると、大学内輪の自己満足に陥っていないか検証した方がよいのではないかとも感じる。


▼新型コロナに関連したフリーランスへの経済的支援(p. 22)


半数くらいの国でフリーランスへの支援があるようだ。
日本でも「持続化給付金」があり、給付のハードルはそれほど高くないので、対象者かどうか確認しておきたいところである。



前年までの調査に関するブログ記事は以下の通りである。
・ヨーロッパ翻訳業界調査2019年版を読む
 http://blog.nishinos.com/archives/5472077.html
・ヨーロッパ翻訳業界調査2018年版を読む
 http://blog.nishinos.com/archives/5360143.html
・ヨーロッパ翻訳業界調査2017年版を読む
 http://blog.nishinos.com/archives/5211703.html
・ヨーロッパ翻訳業界調査2016年版を読む
 http://blog.nishinos.com/archives/5185598.html
このエントリーをはてなブックマークに追加

↑このページのトップヘ