Googleが音声認識API公開へ=モバイル機器は音声操作が主流に?【湯川】

non-CategoryAPI, google, recognition, speech, 公開, 検索, 音声認識技術

 iPhoneなどで利用できるGoogleアプリの音声認識技術の精度の高さは定評があるが、その音声認識技術のAPIを公開されることが明らかになった。ドイツのベルリンで開催中の家電業界の見本市IFA2010でGoogleのCEO、Eric Schmidt氏が行った基調講演の中で、Googleの担当者が会場からの質問に答えたもの。モバイルアプリを開発するサードパーティー向けに近くAPIを公開するという。

 Googleの音声認識技術の精度が高いのは、だれよりも多くの検索データを持っているからだ。Google検索は、スペルを間違って入力しても、過去の無数の入力データを基に推測し正しいスペルを「もしかして」と提案してくれる。これと同様の仕組みで、聞き取りにくい発声であっても正しいキーワードを推測できるようになっている。


 現時点ではGoogle提供のアプリの中でも検索アプリにしか音声認識技術は利用されていないが、今後GoogleのAdroidケータイのあらゆる機能に音声認識技術が搭載されるもよう。基調講演の中のデモでは「〇〇さんに電話」と発声するだけで、連絡帳の中から電話をかけたい相手を探して自動的に電話をかける機能や、言葉が通じない者同士でも通訳アプリを使って話ができる機能が紹介された。IFAのサイト上の動画の中で、そのデモを見ることができる。(1時間程度の動画だが、その真ん中辺りにGoogleの男性担当者が実演している)。

蛇足:オレはこう思う
iPhoneのグーグルマップでの検索の精度がかなり向上している。検索したい範囲に地図を縮小・拡大してから検索すると、その地図上に存在する検索結果だけが赤いピンで表示される。有楽町周辺の地図を表示して「プロント」と検索すると東京国際フォーラムのプロントの場所にピンがドロップする。ちなみにTeamTechWaveはこのプロントで飲み兼ミーティングをやってます。関係ないけど。
 この地図の検索が音声でできるようになれば、うれしいなあ。Googleさん、地図検索を重宝してまーす!早く音声認識技術を地図にも搭載してくださいね。待ってまーす!

 Googleの音声認識ってほんとに精度がいいから、API公開されればいろんなサードパーティが音声で操作できるアプリを作ってくるんじゃなかな。そうなるとスマートフォンって、音声操作が主流になるかもしれない。

 APIはだれに対しても公開されるんだろうなあ。もしAppleに対して公開しないとなったら、Androidケータイが俄然優位に立つと思う。Googleはそんなことしないとは思うけど。