JTFジャーナルの連載「翻訳品質のランチボックス」が最終回を迎えました。294号の「第8回:仕様とJTF翻訳品質評価ガイドライン」という記事です。
JTF会員でなくても、アカウントを作成するとPDF版を無料で読めます(無料期間の終了時期は未定)。またJTF会員には近日郵送されるはずです。
リンクはこちら:https://journal.jtf.jp/
記事の内容を簡単にまとめると次のようになります。
現在海外では、翻訳成果物の要件などについて受発注者が合意して作成する「仕様」の考え方が広まりつつあります。仕様には納期やワード数などの情報に加え、品質評価時の項目(エラー・カテゴリー)や合否しきい値などについても盛り込みます。本年中の完成を目指す「JTF翻訳品質評価ガイドライン」でも仕様に基づく評価方法をベースにしながら、日本語に対応したエラー・カテゴリーを提示します。
◆
なお、同号特集「ニューラル翻訳を超える未来へ」では、長尾真氏と賀沢秀人氏(グーグル)が対談をしています。これは現在のニューラル機械翻訳(NMT)の解説というより、その「次」を語るという内容です。
印象深かった部分を1つ挙げてみます。
本ブログでも何回か書いています(下記リンク参照)が、「翻訳」はテキストに書かれた情報だけでできるわけではなく、テキスト外部にある文脈や状況に関する情報を取り込む必要があります。しかし現在までの機械翻訳(ルールベースも統計もニューラルも)では、テキストに書かれた情報しか利用していません。
人間はテキスト外部の情報も取り込んで「翻訳」できます。もちろんダメな翻訳者は文法に従って単語を組み替えるようなこともしますが、少なくとも人間にはテキスト外部の情報を取り込む能力はあります。
人間がしてきた翻訳を「翻訳」と呼ぶなら、機械翻訳がやっていることは実はまだ「翻訳」ではありません。テキスト外部の情報も取り込んで初めて「翻訳」と言えるはずです。
対談にあるように、そちらの方面に研究が進むのだとしたら、実に楽しみです。
<本ブログの関連記事>
・ホフスタッター氏による機械翻訳考察(2018-02-05)
・機械翻訳は「翻訳」をしていない(が役に立つ)(2017-12-01)
・機械で「翻訳」をしているのか(2016-03-18)
以上です。
JTF会員でなくても、アカウントを作成するとPDF版を無料で読めます(無料期間の終了時期は未定)。またJTF会員には近日郵送されるはずです。
リンクはこちら:https://journal.jtf.jp/
記事の内容を簡単にまとめると次のようになります。
現在海外では、翻訳成果物の要件などについて受発注者が合意して作成する「仕様」の考え方が広まりつつあります。仕様には納期やワード数などの情報に加え、品質評価時の項目(エラー・カテゴリー)や合否しきい値などについても盛り込みます。本年中の完成を目指す「JTF翻訳品質評価ガイドライン」でも仕様に基づく評価方法をベースにしながら、日本語に対応したエラー・カテゴリーを提示します。
◆
なお、同号特集「ニューラル翻訳を超える未来へ」では、長尾真氏と賀沢秀人氏(グーグル)が対談をしています。これは現在のニューラル機械翻訳(NMT)の解説というより、その「次」を語るという内容です。
印象深かった部分を1つ挙げてみます。
長尾:<中略>あるいは完全に使うためにはテキストの情報だけじゃなくて、テキストが発話された環境や状況を追加する必要があるのではないかと思います。
今のディープラーニングでやる機械翻訳のクオリティをもうひとつ超えるためには、たとえば今対話しているこの状況に関する情報が欠けている面があるからだめなんじゃないかという気がしてまして、<後略>
本ブログでも何回か書いています(下記リンク参照)が、「翻訳」はテキストに書かれた情報だけでできるわけではなく、テキスト外部にある文脈や状況に関する情報を取り込む必要があります。しかし現在までの機械翻訳(ルールベースも統計もニューラルも)では、テキストに書かれた情報しか利用していません。
人間はテキスト外部の情報も取り込んで「翻訳」できます。もちろんダメな翻訳者は文法に従って単語を組み替えるようなこともしますが、少なくとも人間にはテキスト外部の情報を取り込む能力はあります。
人間がしてきた翻訳を「翻訳」と呼ぶなら、機械翻訳がやっていることは実はまだ「翻訳」ではありません。テキスト外部の情報も取り込んで初めて「翻訳」と言えるはずです。
対談にあるように、そちらの方面に研究が進むのだとしたら、実に楽しみです。
<本ブログの関連記事>
・ホフスタッター氏による機械翻訳考察(2018-02-05)
・機械翻訳は「翻訳」をしていない(が役に立つ)(2017-12-01)
・機械で「翻訳」をしているのか(2016-03-18)
以上です。