rnishino

IT翻訳者Blog

翻訳、英語、ローカリゼーション、インターナショナリゼーションなどについて書いています。

31 3月

ビデオ会議の自動文字起こしをAWSで試す

Zoomなどでビデオ会議をしたら、ある程度の精度で構わないので、自動で文字起こしをしたいことがある。
日本語の自動文字起こし専用サービスもいくつかあるようだが、今回はすでにアカウントを持っているAWSのAmazon Transcribeを試してみた。

詳しい使い方はAWSの説明にあるが、手作業でのステップを簡単に説明すると次のようになる。

  1. AWSのストレージサービスである「S3」にオーディオまたはビデオのファイルをアップロードしておく(対応ファイル形式は、MP3、MP4、WAV、FLAC、AMR、OGG、WebMのようだ)

  2. Transcribeでジョブを作成する。ここでS3上のファイルを指定

  3. 実行し、しばらく待つとジョブが完了する

  4. 文字起こしファイルをダウンロードする


設定で「Speaker identification」(話者特定)をしておくと、自動で話者を認識して分割して書いてくれるので便利だ。
なお、料金は30分の動画で「0.72ドル」(約80円)とのことである。



このようにとても簡単なのであるが、困った点が1つあった。
最後にダウンロードするファイルがJSON形式なのである。JSON自体はテキストファイルなのでどのようなエディターでも開ける。しかし話者特定すると、どこからどこまでを誰が話したといったメタ情報が付加されるため、単純なテキスト構造にはならないのである。



もちろん変換プログラムを自作すればよいが、時間がかかりそうだ……と思っていたところ、やはり作ってくれていた人がいた! ありがたい。

 aws-transcribe-transcript
 https://github.com/trhr/aws-transcribe-transcript

ただしPythonなので、パソコンにPythonがインストールされており、コマンドで操作する必要がある。
まず上記Githubサイトからtranscript.pyをダウンロードし、ローカルのフォルダーにJSONファイルと一緒に置く。そして「python transcript.py asrOutput.json」のように(Macならターミナルから)実行すれば、整形されたテキストファイルが出力される。次のような感じである。



話者は2人(spk_0とspk_1)で、きちんと分割して表示されている。時間(「0:38:29」など)も表示されているので、ビデオを見返す際にも便利だ。

ちなみにブラウザー上で変換できるサービスもあるようだ。こちらはSRTというファイル形式で出力されるが、中身はテキストなのでJSONと同様にエディターで開ける。
ただ、自分のファイル(40分程度の文字起こし)で試したらブラウザーがクラッシュしてしまったので、使い心地は分からなかった。あまり大きなファイルは変換できないのかもしれない。



音声認識自体の精度にまだ課題はあるだろうが、目で見て手で書き起こす手間を考えたら、労力は大幅にカットできそうだ。
28 1月

プログラミング英語を検索できるページを公開

プログラミング英語検定のサイトで、プログラミング英語のコーパスを検索できるページを公開しました。

こちら:https://progeigo.org/corpus-search/
(※追記:URLを修正しました。2021-03-25)

corpus-search_20210127

実際に使われている英語サンプルを検索できるので、特に英語を書く際の参考になるはずです。日本語からも英語からも検索可能です。

実は以前に似たようなものを個人で作っていたのですが、検索処理に時間がかかり過ぎる(Google Apps Scriptが原因)ので、今回作り直してプログラミング英語検定のサイトに置きました。

検索できるドキュメント・タイプはまだ「UI」のみですが、徐々にデータを追加するつもりです。
7 1月

JTFジャーナルがウェブメディアとしてスタート

日本翻訳連盟(JTF)が印刷冊子として発行していた「JTFジャーナル」は、2021年1月からウェブに移行しました。

JTFジャーナル WEB版
https://webjournal.jtf.jp/



これに伴い、河野弘毅さんから私が編集長を引き継ぐことになりました。

印刷版はじっくり読める記事が多数掲載されている点が良かったのですが、2か月に1度の発行だったため、速報性のあるニュースを出しにくいという弱点もありました。そこでウェブ版では、じっくり読める記事も掲載しつつ、翻訳業界の最新ニュースを中心に取り上げる予定です。



じっくり読める記事としては、まず「連載」があります。リンギストに焦点を当てたインタビュー記事連載「リンギストの仕事」と、機械翻訳の最新動向を紹介して考察も加える連載「Transformed」です。

ほかに「特集」として、翻訳祭やJTF主催セミナーなどの報告を掲載します。

また、JTF会員自身で投稿できる機能も追加しました。法人会員はニュースリリース(プレスリリース)、個人会員は(自分で主催する)勉強会情報です。



上記のように、ウェブ版JTFジャーナルで中心となるのは、翻訳業界の最新ニュースです。

大きめのニュースは個別記事としますが、小さめあるいは参考までのニュースは週に1度「週間ニュースまとめ」という形で掲載します。

情報提供のフォームも設置しています。取り上げるべきだと思われる業界ニュースやイベントがあれば、フォームからぜひお知らせください。
著書/訳書
血と汗とピクセル
『血と汗とピクセル』


アプリ翻訳実践入門
『アプリ翻訳実践入門』


ソフトウェアグローバリゼーション入門
インプレス刊
『ソフトウェアグローバリゼーション入門』

達人出版会刊
『ソフトウェア・グローバリゼーション入門』


英語語源が魔術に変わる世界では
『英語語源が魔術に変わる世界では』


現場で困らない! ITエンジニアのための英語リーディング
『IT英語リーディング』


アプリケーションをつくる英語
紙版
『アプリケーションをつくる英語』

電子版
『アプリケーションをつくる英語』
第4回ブクログ大賞受賞】