2012-10-31

Courseraの講義を翻訳してみた

ぐぐぷらを眺めていたら、行動的な知り合いがCouseraの講義に字幕をつけるのを手伝いたい、と申し出ていたのに気づいた。その後の進展を見ていると、実はCouseraの字幕翻訳という話はとっくにあって、amaraというサービスでボランティアベースで進めているらしい。

へえ、そりゃ面白い、ちょっくらやってみよう、などという軽い好奇心から、やってみたのでした。それがこちら。データ構造の講義の、赤黒木についての話です。以下はその体験談なのですが……

予防線を張っておきますが、この手の記事にありがちな「みんなもやってみよう!」という感じの気分にはなりませんでした。ぼくと同じく「へえ面白い、ちょっくらやってみようかな」と感じた人は、記事を最後まで読んでください。

さて。

どんな感じの作業になるかというと、少なくともCourseraの講義については、すでに英語字幕がついています。なので、その字幕をもとに淡々と日本語に訳していくということになります。ツールが使い辛いということはなく、あんまり問題はない気がします。ぼくはそのままブラウザで作業しました。

ですが、根本的に翻訳というのはしんどいわけです。どんな本でも一緒で、読むのはすぐでも翻訳となれば数倍とか数十倍という時間がかかります。読む場合にはなんとなく雰囲気で流しちゃうような細部の単語についても、きちんとどういう意味があり、文全体の構造を把握し、正しく日本語にしなければなりません。

もちろん、専門用語がバリバリなので、術語は定訳を使わなければいけないし、本当は同じ単語は同じように訳すといった労力を払う必要があります。あと、コンピュータ関係に特有の問題としては、カタカナ語が多いので、字幕の枠にあわせるのが大変な気がします。

しかも、講義というのは話し言葉なので、言いよどんだり、文法的に変な言葉になっちゃったりということもあります。なおかつ、映画の字幕とかと一緒で、あまり長文にならないよう、元の発言と時間的にもかけ離れたことにならないよう、気をつけて訳さないといけません。

さらに講義資料がある上でのことなので、「ここでこのノードが……」みたいな文章になっていると、英文字幕の字面だけから単に訳すというのは実際ムリで、講義を聞いてみて、こういうスライドでこういう言葉ならこういう訳になるか、などと確認しながら進めていくことになります。

さらにさらに追い打ちをかけるような問題としては、英語字幕の品質にも疑問があります。たぶん音声認識をベースにしていると思われ、不思議な字幕になっていることがあります。英文字幕だけから翻訳するとえらいことになりそうです。

結論を一言でいうと、「こりゃー大変だな」って感じです。たかが20分の講義ですけど、訳すのは何時間もかかりました。映画字幕の翻訳とかの大変さも垣間見ました。

というわけで、素人にはおすすめできない

翻訳することで講義内容と英語を同時に勉強、といったお気楽なつもりで始めたらいっかな終わらない気がします。自分でよく理解している内容について書いてこんなレベルですからね。自分の知らない内容については、翻訳しないほうがよいのではないかと思います。

期待されるのは、高い専門知識を持った人間が長時間をかけて頑張れる仕組みである気がしており、こういうものこそ大学とか公的機関で、地道にやっていくのが望まれるのかなあ、などとぼんやり考えました。ボランティアベースではしんどい気がするなあ。正直、私は「もうしばらくはいいや」っていう気分です。

あ、ところで上の私がやった訳ですが、もちろんたくさん間違いが含まれていると思います。見て気づいた点があったら、どんどん直していってください。そういう細かい修正は、ボランティアベースが効く気もします。

---

ともあれ、Couseraの翻訳というのは、未来を感じるのは確かです。こうして優れた講義がオンラインで誰でも受講できるとなると、すごいことになるんじゃないかと、期待だけは胸を膨らませておきたい。