rnishino

IT翻訳者Blog

翻訳、英語、ローカリゼーション、インターナショナリゼーションなどについて書いています。

英語

28 10月

IT分野の英文サンプルを検索できるサイトを作りました

英語を書く際、実在する英文サンプルを参考にしたいときがあります。
しかしウェブ検索だとうまく引っかからなかったり、自分が書いているドキュメント・タイプに合致した表現を検索結果から取捨選択しなければならなかったりします。
こういうときには分野に特化したコーパス(言語資料)があると便利です。

そこで、IT分野で書く機会がありそうなドキュメントの英文コーパスを作ってみました。

IT英文サンプル検索コーパス
http://itenglishsearch.nishinos.com/



英語原文に対して(ほぼ機械翻訳で)日本語訳を付けてあるため、日本語検索キーワードから英文サンプルを見つけることも可能です。
収録したドキュメント・タイプは「UI」、「ユーザー・マニュアル」、「開発者ガイド」の3つです。合計のワード数は20万超(執筆時点)で、今後も増やしていく予定です。
詳しい使い方や注意点は、上記ページのリンク先で説明しています。



ここからは技術的な話です。
上記サイトはGoogle Apps Script(GAS)のHTML Serviceで作っています。データはGoogleスプレッドシートにまとめておき、それに対して検索をかけ、結果をGoogle Sitesに埋め込んで表示するという流れです。
スプレッドシートの中はこんな感じです:



当初はクラウドでサーバーを立ててデータベースを用意しようとも思ったのですが、それほどアクセスが多いわけでもありませんし、やはりスプレッドシート形式だとちょっとした更新作業や内容確認などが楽なので、運用の手間やコスト(Googleのは無料)を考えてGASを使うことにしました。
(ただし動作は若干遅いかもしれない)

Googleスプレッドシートにデータを集めて検索してもらう方法は、例えばIT企業や翻訳会社が自社の「用語」をまとめておき、それを社内外から参照してもらうようなこともできそうです。
Googleアカウントでアクセス制限をかければ、関係者(例:外注契約した翻訳者)のみに使ってもらうことも可能です。スプレッドシートならITに疎い人でも更新作業はできるでしょう。

以上です。
10 9月

Google開発者向け文書スタイルガイドの要点

Googleが開発者向け文書で使っていた英語スタイルガイドが社外に公開された(Googleブログ)。
URLはこちら:

 Google Developer Documentation Style Guide
 https://developers.google.com/style/

MicrosoftやIBMは自社の英語スタイルガイドを書籍(リンク:MSIBM)として販売するしているし、Appleは公開(リンク)している。Googleもマテリアル・デザインの一部としてスタイルを公開してはいる(リンク)が、分量が少ないため、他社と比べるとどうしても見劣りした。
そのため、「開発者向け文書」を対象としてはいるものの、ある程度の規模のスタイルガイドが公開されたのは意義深い。

そこで今回は、同スタイルガイドの要点(highlight)のみについて読んでみたい。

 Highlights
 https://developers.google.com/style/highlights

Highlights

◆Tone and content(トーンとコンテンツ)
・Be conversational and friendly without being frivolous.

 → 会話っぽく、親しみがある感じだが、軽すぎないように
 いきなり非ネイティブにとって難しい…。ただいくつか具体例が挙げられている。例えば、
 - すべての文を同じフレーズ("You can ..."や"To do")で始めない
 - 本当に高揚するような状況以外では、感嘆符(!)は避ける
 - 指示の文で「please」は不要

・Don't pre-announce anything in documentation.
 → 将来の機能や製品について書かない
 これはコンテンツに関する内容だが、Google社内では重要だったのかもしれない。一般的なスタイルガイドとしてはあまり意味がない項目だと思われる。

・Use descriptive link text.
 → リンク先を説明するようなテキストにする
 要するに「ここをクリック」みたいなのは避けよ、ということになる。だから本ブログ記事にある書き方もダメで「Appleは公開(リンク)している」ではなく「Appleは公開(Apple Style Guide)している」となる。

・Write accessibly.
 → アクセスしやすいよう書く
 障がいのある人だけでなく、海外の(英語が母語でない)ユーザーや古いブラウザーを使っているユーザーにとってもアクセスしやすくするということらしい。
具体的には、文法や句読点を正しく使ったり、能動態や現在形を使ったり、スラングなどは避けたり、といった点が挙げられている。

・Write for a global audience.
 → 世界中の読者に向けて書く
 翻訳されることを意識しながら書くということだ。例えば、短く明瞭な文を書く、一貫性を持たせる、略語を使わない、特定文化の色が濃すぎないようにする、といった点が挙げられている。最後のは、例えばタッチダウン(アメフト)やホームラン(野球)みたいな用語は、そのスポーツが普及していない国では理解されにくい、ということだ。

◆Language and grammar(言葉づかいと文法)
・Use second person: "you" rather than "we."

 → 二人称(you)を使って書く
 読者をyouで指して書きましょうということのようだ。

・Use active voice; make clear who's performing the action.
 → 能動態を使う。行為者を明確にする
 受動態を使うと行為者をぼかすことができる(例:The file can be downloaded.)が、可能な場面ではそれを明確にしましょう(例:You can download the file.)ことだ。

・Use standard American spelling and punctuation.
 → アメリカ式のスペルと句読点を使う
 例えばcenter(米)とcentre(英)がある。ちなみにスタイルガイドに掲載されていたのが、英米で違うスペルの一覧(リンク)が興味深い。

・Put conditional clauses before instructions, not after.
 → 条件を表す節は、指示よりも先に書く
 スタイルガイドに挙げられている例だと、
  ✕ Click Delete if you want to delete the entire document.
  ◯ To delete the entire document, click Delete.
となる。
 これはテクニカル・ライティングでよく言われる点で、最初に指示「Click Delete」を書くと、いきなり削除してしまう人がいるとされるためだ。

・For usage and spelling of specific words, see the word list.
 → ある単語の使い方とスペルはWord listを参照
 この語リストは非常に役に立ちそうだ。例えば「app」か「application」かで迷ったら、ページ内検索すると「appを使う」と出てくる。ほかも、deselectは使わず「clear」にする、disableは使わず「turn off」にする、といった項目がある。

◆Formatting, punctuation, and organization(書式、句読点、構成)
・Use sentence case for document titles and section headings.

 → 文書のタイトルとセクション見出しでは、センテンス・スタイル(sentence case:最初の単語のみキャピタリゼーション)にする
 キャピタリゼーションとは、単語の最初の文字だけ大文字にすること。
 つまり、上記の例は、
  ✕ To Send a Message to Other Users
  ◯ To send a message to other users
ということになる。
 ちなみに✕の例文(タイトル・スタイルとも)でも、aとtoは小文字になっている。タイトル・スタイルでキャピタリゼーションする場合も、冠詞や短い前置詞などは小文字のままになるというルールがある。

・Use numbered lists for sequences.
・Use bulleted lists for most other lists.

 → 手順では数字のリストを使う
 → それ以外のほとんどのリストではブレット(中黒)を使う
 列挙する際に数字を使うのは、何かしら順番があるものだけにしましょうということ。テクニカル・ライティングでは一般的に知られている手法だ。

・Use description lists for pairs of related pieces of data.
 → 関連するデータのグループには、説明的なリストを使う
 頭に数字、アルファベット、ブレットは無しで、名前そのものを列挙しましょうということのようだ。

・Use serial commas.
 → シリアル・カンマを使う
 シリアル・カンマとは、3つ以上の項目をorやandで列挙する場合、最後の項目の前にカンマを置く方法だ。
  ✕ A, B, C and D
  ◯ A, B, C, and D

 実はこのシリアル・カンマは英語圏で熱い論争がある(ウィキペディア英語版のSerial comma)。何か月か前には、シリアル・カンマが判決を左右したというニュースもあった。

・Put code-related text in code font.
 → ソースコードにはコード用フォントを使う
 開発者向け文書ではソースコードが頻出するため、通常のテキストと見分けやすくするためだと推測できる。

・Put UI elements in bold.
 → UI要素にはボールドを使う
 例えばボタン名やメニュー名について、角カッコ([Edit])や引用符("Edit")を使うのではなく、ボールド(Edit)にするということだ。

・Use unambiguous date formatting.
 → 曖昧さのない日付形式を使う
 「月名 日, 年」という形式を使い、月名はスペルアウトするとしている。例えば「September 10, 2017」で、Sepみたいな略も避ける。
 アメリカとイギリスでは月と日の順番が逆になり、「08/09/2017」みたいな書き方は8月9日なのか9月8日なのか分からないことがある。

◆Images(画像)
・Use SVG files or crushed PNG images.
 → SVGファイルか圧縮PNG画像を使う

・Provide alt text.
 → alt属性にテキストを入れる

・Provide high-resolution images when practical.
 → 高解像度の画像が役立ちそうであれば使う


要点(highlights)は、細かなルールというより、書く際の姿勢みたいな内容も入っている。
長文の英語は書かないものの、UIのボタン名あたりを書くエンジニアであれば「Word list」でページ内検索をかけて確認する程度の使い方でも有用かもしれない。
19 2月

この英英辞典を使え

英英辞典は、英単語の定義や説明が英語で書かれています。日本語における「国語辞典」です。

「英語が分からないから辞書を引くのに、説明が英語なら意味が無いじゃないか」と思う人もいるでしょうが、実は英語で書かれているから良いのです。
英和辞典であれば、日本語での意味(訳語)だけ見て理解したと考えるケースが多いでしょう。例えばdestroyを英和辞典で調べ、「ああ、『壊す』か」と理解します。しかしこれは対応しそうな日本語が分かったというだけであり、destroyが示す意味の範囲を理解したわけではありません。「壊す」と「destroy」では、意味範囲は必ずしも一致しません。

もちろん親切な英和辞典では意味範囲まで解説していますが、使う人が少し読んで「ああ、『壊す』か」と納得してその英和辞典を閉じてしまうと、それ以上踏み込んで調べようとしないでしょう。そういった点では日本語がない英英辞典で、定義や説明や用例をじっくり読んで把握する方法も勧められるわけです。まあ頭を「英語モード」に切り替える感じでしょうか。
私の場合、「訳語」を見つけるのに英和辞典、「意味」を調べるのに英英辞典を使っています。

そこで、有名どころのオンライン英英辞典をいくつか紹介します。

・Oxford
http://oaadonline.oxfordlearnersdictionaries.com/

・Collins
http://www.collinsdictionary.com/

・Macmillan
http://www.macmillandictionary.com/

・Cambridge
http://dictionary.cambridge.org/dictionary/american-english/

・Longman
http://www.ldoceonline.com/

個人的には最初の2つ、Oxford Advanced American DictionaryとCollins American English Dictionaryを頻繁に使っています。
Oxfordは基本単語の解説が充実していて、似た言葉の使い分けなども詳しいという印象です。例えば「walk」。
Collinsは同義語などの関連情報が一緒に出てくるので便利です。語の使用頻度が時系列的にグラフで表示されたりします。例えば「blog」を調べると、2004年あたりから登場したことが分かります(ページ右下)。

以上です。
18 10月

GoogleのNgram Viewerに高度な機能

TechCrunchの記事によると、GoogleのNgram Viewerに新しく高度な検索機能が付いたようです。

GoogleのNgram Viewerが新機能を加えてアップデート, ワイルドカードも使える
http://jp.techcrunch.com/2013/10/18/20131017google-updates-ngram-viewer-with-improved-search-tools/


Google Ngram Viewerというのは、大量の本(コーパス)を検索して年ごとにヒット数を調べられるサービスです。特定の英語表現の流行り廃りがグラフで見られます。英作文をするとき、「和英辞書に書いてあるけど、こんな英語は今使われているのかな…」といった場面でも活用できます。

追加されたのは、ワイルドカード検索、活用形をまとめて検索、大文字/小文字を区別しない検索、品詞タグを指定した検索、演算子を使った検索のようです。詳しくはこちらの説明:

Advanced Usage
https://books.google.com/ngrams/info#advanced


ワイルドカードや品詞タグの利用例です。

例えば「Japanese」という単語の後にどのような「名詞」が続くのか、時系列で1920〜2000年までを検索してみます。
ここで使っている式は「Japanese *_NOUN」です。アスタリスク(*)はワイルドカード、「_NOUN」はそのワイルドカードの品詞が「名詞」であるという指定です。ワイルドカードに名詞という指定をしない場合、「Japanese and」や「Japanese in」といったものまでヒットしてしまいます。品詞タグの種類は、上記「Advanced Usage」のリンク先に説明があります。


(Ngram Viewerのサイトでグラフを見る場合はこちらのリンクから)

グラフを見ると、例えば「Japanese troops」や「Japanese forces」といった軍に関連した語は1930年頃から1940年代半ばに増えています。逆に「Japanese economy」は1940年代半ばから徐々に増え始め、1990年頃にピークになっています。こんな具合に「Japanese 何とか」に対する関心を時系列に探せるわけです。


ちなみに品詞を指定してコーパス検索したい場合、ウェブ上であればCOCAなども使えます。こちらは時系列グラフは表示できません。

22 8月

Androidアプリで使われている英単語の特徴

Androidに標準で入っているアプリケーションのユーザーインターフェイス(UI)で使われている英単語の特徴を調べてみました。

ここでアプリケーションとは、時計や音楽プレイヤーなど全41種類です。例えば「設定」も実はアプリケーションで、こんな英単語が使われています。
screen


今回は特に何らかのアクション(行為、動作)を表す英単語を選んでみました。品詞で言うと動詞が主です。UIは人間とコンピュータとのやり取り(命令など)を仲介し、その際にアクションを表す単語は重要だからです。

まず、単純に登場頻度が高い上位30です。アルファベット順に並んでおり、右側の数字は(株)アルクが出している「標準語彙水準SVL12000」です。数字が大きいほど難易度が高くなります。
freq30

レベルが5以上またはレベル記載がない単語のセルに色を付けています。当然と言えば当然ですが、よく登場する単語は難易度が低いものがほとんどです。
deleteやdisableといった単語は、実は比較的難易度が高いようです。deleteはキーボードにあるので普段から目にしていますが…。syncはsynchronizeの省略形で「同期する」という意味です。Androidアプリではよく使われる英単語のようです。


さて、次は単純に登場頻度で見るのではなく、一般的な英語と比較し、目立って多く登場するアクション関連の英単語を30個拾ってみます。ここでは American National Corpus というコーパスと比べます。
比較にはカイ二乗統計量というものを使うのですが、簡単に言うと、「本来この単語はこの程度登場することが期待されているが、Androidアプリでは期待よりも多く登場する」ことを数字で表せます。この数字が大きい単語はAndroidアプリで特徴的な英単語と言えます。
distin30

こちらもSVLでレベル5以上、またはレベル記載なしの単語のセルに色を付けてあります。やはり、いかにもアプリケーションに使われそうな単語が多くあります。一般的な英語ではあまり使われないため、レベルが高いものも多くなっています。


英語学習者や英語アプリ利用者にとっては、これらの表は次のように活用できると思います。まず、「単純に頻度の高い英単語」を知っているかどうかを確認します。これらの単語は英語アプリを使いこなすのに必須です。頻度の高い英単語を理解していたら、次に「アプリに特徴的な英単語」を確認します。これによって、一般的な英語学習では出会う可能性が低い英単語も習得できます。

今回はAndroidアプリのみを調査対象としているため、必ずしもあらゆる英語版アプリに該当するとは限らない点にご注意ください。

以上です。
筆者について
西野 竜太郎
(Ryutaro Nishino)

翻訳者。合同会社グローバリゼーションデザイン研究所・代表社員。日本翻訳連盟・理事。
プロフィールや連絡先などについては会社のウェブサイトをご覧ください。
著書
ソフトウェアグローバリゼーション入門
インプレス刊
『ソフトウェアグローバリゼーション入門』

達人出版会刊
『ソフトウェア・グローバリゼーション入門』


現場で困らない! ITエンジニアのための英語リーディング
『IT英語リーディング』


アプリケーションをつくる英語
紙版
『アプリケーションをつくる英語』

電子版
『アプリケーションをつくる英語』
第4回ブクログ大賞受賞】