TechCrunchの記事によると、GoogleのNgram Viewerに新しく高度な検索機能が付いたようです。

GoogleのNgram Viewerが新機能を加えてアップデート, ワイルドカードも使える
http://jp.techcrunch.com/2013/10/18/20131017google-updates-ngram-viewer-with-improved-search-tools/


Google Ngram Viewerというのは、大量の本(コーパス)を検索して年ごとにヒット数を調べられるサービスです。特定の英語表現の流行り廃りがグラフで見られます。英作文をするとき、「和英辞書に書いてあるけど、こんな英語は今使われているのかな…」といった場面でも活用できます。

追加されたのは、ワイルドカード検索、活用形をまとめて検索、大文字/小文字を区別しない検索、品詞タグを指定した検索、演算子を使った検索のようです。詳しくはこちらの説明:

Advanced Usage
https://books.google.com/ngrams/info#advanced


ワイルドカードや品詞タグの利用例です。

例えば「Japanese」という単語の後にどのような「名詞」が続くのか、時系列で1920〜2000年までを検索してみます。
ここで使っている式は「Japanese *_NOUN」です。アスタリスク(*)はワイルドカード、「_NOUN」はそのワイルドカードの品詞が「名詞」であるという指定です。ワイルドカードに名詞という指定をしない場合、「Japanese and」や「Japanese in」といったものまでヒットしてしまいます。品詞タグの種類は、上記「Advanced Usage」のリンク先に説明があります。


(Ngram Viewerのサイトでグラフを見る場合はこちらのリンクから)

グラフを見ると、例えば「Japanese troops」や「Japanese forces」といった軍に関連した語は1930年頃から1940年代半ばに増えています。逆に「Japanese economy」は1940年代半ばから徐々に増え始め、1990年頃にピークになっています。こんな具合に「Japanese 何とか」に対する関心を時系列に探せるわけです。


ちなみに品詞を指定してコーパス検索したい場合、ウェブ上であればCOCAなども使えます。こちらは時系列グラフは表示できません。