サイトアイコン TechWave(テックウェーブ)

ケータイが音声操作ツールに進化=豊富な検索データを持つGoogleならでは(Voice Action解説)【湯川】

 iPhoneの機能で僕自身最も重宝しているのがGoogle検索の音声認識機能だ。僕の自動車のカーナビにも音声認識機能がついているのだが、「自宅へ帰る」と発生するとラジオがかかったりするので、ほとんど使い物にならない。音声認識ってその程度のものだと半分あきらめていたのだが、iPhoneのGoogle検索の音声認識は本当にかなり正確に機能する。イントネーションが大阪弁でも、鼻づまりの声で発生しても、まず間違いなく認識してくれるのだ。

 ほかの音声認識ツールに比べGoogle検索の音声認識はなぜこうも正確に認識できるのだろうか。

 実はマイクがいいとかそういうことが理由ではない。Googleが検索データをだれよりも多くもっているからこそ、音声認識の精度がいいのだ。詳しく説明してみよう。

【関連記事:音声入力でAndroidケータイが激的に進化【湯川】 : TechWave


 以前、Googleの従業員番号1番という人物が来日したときにインタビューさせてもらったことがある。このGoogle最初の従業員といろいろな話をしたのだが、一番印象的だったのが「検索データが増えれば増えるほど検索の精度が向上する」という話だった。素人的な考えだと、検索データが増えるとより多くのデータの中から探してこないといけないので検索精度が下がるような気がするのだが、実は反対らしいのだ。

 例えば同じ1つのキーワードで検索した結果の中で、どのウェブページが一番クリックされるのかが分かる。それが分かれば、そのキーワードで検索したユーザーに対して過去最もクリックされたウェブページを表示することができるようになる。検索精度が上がるわけだ。

 間違ったスペルで検索する人のデータが多くなってくれば、ミススペルとクリックされたウェブページの内容を照らし合わせることで、ミススペルしたユーザーが本当はどうスペルしたかったかが推察できる。Google検索には、珍しいキーワードで検索すると「もしかして」と、別のキーワードでの検索を提案する機能がある。過去のミススペルや入力間違いのデータを無数に集計することで、入力間違いである可能性の高さを察知し「もしかして」と、使用頻度の高いキーワードを推薦してくるわけだ。僕の場合はGoogleが「もしかして」と提案してくるときには実際に入力ミスしている場合が多いので、非常に便利な機能である。

 この「もしかして」の仕組みが音声認識機能にも応用されているので、Googleの音声検索の精度が高いのだ。発声が聞きづらくても、訛りがきつくても、Googleの検索エンジンは「もしかして」と推察し、正しいと思われるキーワードで検索してくれる。世界で一番多くの検索データを持つGoogleが作る音声検索だからこそ、音声を正確に認識してくれるのである。

 ということで音声検索はこれまでもかなり使い勝手はよかったのだが、僕にとって音声認識を一番必要する利用シーンは街中で地図を検索するときだ。近くにカフェがあるのかどうか、すぐに知りたい。テキスト入力しウェブページの店舗案内のページから探す時間があるのなら、とりあえず歩き始めて適当なカフェに入ってしまう。ところが今回の新機能では地図にも音声検索機能が搭載されたという。これはうれしい機能追加だ。

 このほかにも、音声をテキストに変換して自分用のメモを残すという機能も便利そうだ。メールの文章なども音声認識で作成できるみたいだ。実際のデモを見る限り英語の文章の認識は精度がよさそうだが、日本語ではどの程度精度がいいのだろうか。単語の認識はほぼ完璧でも、少し長めの日本語の文章となると少々難しいのではないだろうか。これは実際に日本語対応されるのを待って、試してみたい。

 さてケータイがテキスト入力して操作するデバイスから音声操作のデバイスに大きく進化しようとしているわけだ。モバイルの領域でGoogleの最大のライバルであるAppleはこれにどう対抗してくるのだろうか。iPhoneにも音声認識機能はあるが、やはりあまり精度がよくない。Appleは「もしかして」機能とは別の考え方で、音声認識機能を進化させるのだろうか。それともGoogle検索の唯一の対抗馬になりつつあるMicrosoftのbingとの協力体制を強化して、bingのデータを音声認識に取り込んでくるのだろうか。

【関連記事】
音声入力でAndroidケータイが激的に進化【湯川】 : TechWave

モバイルバージョンを終了