サイトアイコン TechWave(テックウェーブ)

みんなで育てる日本語入力「Social IME」がソースコードを公開 【増田(maskin)真樹】

利用ユーザーが辞書を育てるソーシャル型日本語入力システム「Social IME」が3月13日、ソースコードの公開に踏み切った。(「New BSD License」によるオープンソース公開)

「Social IME」は2007年、当時慶応義塾大学に在籍していた奥野陽氏(以下、ニックネームnokuno氏で統一)が未踏採択プロジェクトとして開発したもの。辞書や変換履歴をサーバーサイドに置き、ユーザーの使用履歴を共有するという設計で、ブログによれば現在は「サーバーサイドのみですが、クライアントサイドや古いバージョンも順次追加していきたいと思います」とのこと。

APIを公開し、外部プログラムからの利用も推奨していた「Social IME」だが、何故ここにきてオープンソース化の道を選択したのだろう。


その辺の懸念は、開発者のブログでも触れられていた。

OSS化については何度も検討しましたが、辞書やデータをサーバーサイドに集約するという基本設計から、OSSとは相性が悪いと考えていました。あり得るとしたらクライアントサイドだけを公開し、サーバーはAPIを通して使ってもらうという形が望ましいと考えたのです

ところが今回、公開されたのはサーバーサイド側のソースコードだ。うまく活用すれば良質な共有辞書データを手に入れることも可能、「Social IME」を超えるオリジナルの日本語入力システムを開発することもできるのかもしれない。

そうなると改めて疑問が浮上する、なぜそんな重要部分をオープンソースに?

最近になって、GoogleやBaiduなどの企業から膨大なウェブデータに基づく統計的かな漢字変換ソフトがリリースされました。これらはクライアントサイドで動作すること、ユーザーデータの共有ではなくクローラーを使って集めたデータを使うこと、などSocial IMEとは異なるアプローチを取っていました。しかしそのように自動構築された辞書の精度が高いことは、皆さんもご存知のことと思います。

結局、アプローチこそ違うものの、GoogleがソーシャルコンテンツをベースとしたIMEをリリースし、その精度が高いことが、nokuno氏に何らかの判断の契機をもたらしたと読み取れる。

【ソーシャル型IME】
・Google 日本語入力…ウェブ上のコンテンツをクロールして辞書を作成
・Social IME…ユーザーが日本語変換した情報(登録辞書、変換履歴)から共有辞書を作成

nokuno氏は「Social IME」の次のステップについて何らかをイメージしていたのかもしれない。しかし、昨年大学卒業後に就職した大手ネット系会社の仕事が忙しいらしく、その辺の状況を加味して、今回のオープンソース化ということになったという話のようだ。

[公式 開発者 nokunoの日記「Social IMEをオープンソース化しました」]
[公式 social-ime – Project Hosting on Google Code]

REMIX ハイブリッド経済で栄える文化と商業のあり方
著者:ローレンス・レッシグ
販売元:翔泳社
発売日:2010-02-27
クチコミを見る

著者プロフィール:増田(maskin)真樹

 1990年より執筆およびネットメディアクリエイターとして活動を開始。
 週刊アスキーを初め、日経BP、インプレス、毎日コミュニケーション、ソフトバンク、日経新聞など多数のIT関連雑誌で活躍。
 独立系R&D企業のマーケティング部責任者の後、シリコンバレーで証券情報サービスベンチャーの立ち上げに参画。
 ネットエイジでコンテンツディレクターとして複数のスタートアップに関与。ニフティやソニーなどブログ&SNS国内展開に広く関与。
 現在、複数のメディア系ベンチャー企業にアドバイザー・開発ディレクターとして関与。大手携帯キャリア公式ニュースポータルサイト編集デスク。
 書き手として、また実業家として長年IT業界に関わる希有な存在。詳しいプロフィールはこちら

モバイルバージョンを終了