Google翻訳 - Official Google Research Blog

http://googleresearch.blogspot.com/2006/04/statistical-machine-translation-live.html
従来の機械翻訳がルールベースのアプローチを取っているのに対し、Google等では統計ベースのアプローチで翻訳を行う研究が進んでいるとのことです。これは、(人間が訳した)原文と翻訳文の対と、それとは別に多くのターゲット文を与え、これを統計処理して「らしい」翻訳文を生成できるようにする方法だそうです。となると、多くのテキストを収集するGoogleは有利ですね。実際に、アラビア語⇔英語の両方向はオンラインで試せるように提供されており(アラビア語わからないので試しませんが)、ニュースなどは小説よりもうまく訳せて、詩なんかはやめたほうがいいというような結果もでているようです。