サイトアイコン TechWave(テックウェーブ)

Google開発中の自動通訳フォンは、ほんにゃくこんにゃくだ

 英紙タイムズのオンライン版は、米Googleが自動通訳フォンを開発中だと報じた。電話に向かって自分の言語で話しかけると、自動的に別の言語に翻訳された音声として電話の向こうのユーザーに伝わるという技術で、Googleの翻訳サービスの責任者であるFranz Och氏によると、基本的な仕組みは2、3年以内に完成する見通しという。

 Googleは既に、ウェブ上の52の言語の文章を自動翻訳する技術と、音声認識の技術の両方を、別々に開発し実用化している。この2つの技術を組み合わせることで、電話向けの自動通訳技術の実用化を目指しているという。完成すれば世界中の人々と自由に電話で話ができる夢の技術となるが、実際に「使える」レベルに達するまでには、まだまだ時間がかかるのではないだろうか。


自動翻訳技術は発展途上と思うが

 タイムズは、文章の自動翻訳技術はかなり精度が上がっているが、音声認識のほうは多彩なアクセントや発音が存在するため実用に耐えるレベルにはなかなか到達しないだろうという専門家の意見を照会している。確かに同じ英語でも、「今日」は米国では「トゥデイ」と発音するがオーストラリアでは「トゥダイ」と発音するなど地域格差が大きく、音声認識技術を完成させるのは容易ではないようにも思われる。

 しかし現時点のGoogleのサービスを日本人が使った場合、音声認識技術の方が文章自動翻訳技術よりも完成度が高いように映るのではないだろうか。

 iPhone3GSには音声認識技術が搭載されているのが、実は精度はあまり高くない。iPhone上のアプリケーションやデータを音声で検索できるようにはなっているのだが、私が発声したキーワードを正しく認識できず間違った検索結果が表示されることが多いので、私自身はほとんど利用していない。

 ところがiPhone上のGoogleの検索アプリの音声認識技術は非常に精度が高い。音声認識技術はiPhone搭載のものを使っているので変わらないはずだが、音声を認識したあとの処理に違いがあると思われる。

 パソコンを使ってGoogleでちょっと変わったキーワードで検索すると「もしかして」と別のキーワードの入力ミスではないか聞いてくることがある。最近ではAppleの新型タブレットパソコン「iPad」の発表があった日に「Apple iPad」というキーワードで検索すると「もしかしてApple iPod?」と聞き返してきた。「iPad」というスペルで検索するユーザーが非常に少ないので、同じようなスペルの単語の中で、検索されることが非常に多い「iPod」という単語の入力ミスではないかと推測してきたようだ。膨大な検索記録のデータベースを解析することでユーザーの入力ミスのパターンを把握し、正しいキーワードを推測するわけだ。

 同様の仕組みが音声認識に追加されているので、iPhone搭載の単純な音声認識技術よりも精度が格段に向上しているのだと思う。私自身、iPhoneではGoogleの音声検索をかなり頻繁に利用させてもらっている。

 一方で、Googleのウェブページの自動翻訳サービスはほとんど利用していない。たまにこのサービスを使って外国語のページを日本語に変換させることもあるが、まったく実用化のレベルではないと個人的に思う。これは日本語がかなり独立した言語体系を持っているからなのかもしれない。ヨーロッパの言語の多くは、言ってみれば1つの言語の方言に過ぎないという話を聞いたことがある。言語体系が似ていたり、単語もラテン語という共通のルーツを持っている場合も多いので自動翻訳してもそれなりに使えるのかもしれない。ドイツ語のページを日本語に自動翻訳したらまったく意味が分からなかったが、英語に自動翻訳すればそれなりに内容が把握できたこともある。

 Googleはこの2つの技術を統合した自動通訳技術が2、3年で完成するとしているが、それはあくまでも基本的な仕組みが完成するという程度ではないだろうか。日本語で実用化に耐えるレベルになるにはまだまだかかるような気がするのだが・・・。

モバイルバージョンを終了