Evernoteがサーバー障害の詳細を正式に発表【湯川】

 日本人ユーザーの間でも人気の高いオンライン・データ・ストレージ・サービスのEvernoteのサーバー障害で7000人のユーザーが影響を受けたという毎日新聞の報道を受け、米Evernote社は「Evernote’s July 1st Server Problem(7月1日のサーバー問題)」というタイトルの発表文を同社サイト上に掲載し、問題の詳細を明らかにした。米国でもこの問題を一部少数のブログやメディアが取り上げたが、反応は概ね同社に好意的で大きな問題にはなっていない。

 発表文によると、サーバー障害が発生したのは7月1日から4日までで、世界中の6,323人のユーザーに影響が出た可能性があるという。この障害が原因でこの期間中にこれらのユーザーが新規で書き込んだり、修正したデータの一部が正常にサーバーに記憶されなかった。同社は影響を受けたユーザー全員に連絡を取り、データ修復の手順を説明したほか、優先サポートを受けられるように6,323人全員を1年間にわたりプレミアムユーザーにアップグレードしたという。

 これまで正式に発表しなかったのは、問い合わせが殺到しサポート要員がその対応に忙殺される事態を避けるためで、まずは影響を受けたユーザーに対するサポートを優先したかったと説明している。


 またEvernoteの仕組み上、専用クライアントソフトを使って記憶したデータはすべてパソコン上にも記憶されているので、影響を受けたユーザーのうち大多数のユーザーがすべてのデータを回復できたとしている。

 ただ同社のサービスは専用クライアントソフトではなく、ウェブブラウザを使っても利用が可能。ブラウザを使って同社のサーバーに直接書き込んだデータに関してはパソコン上にデータが残っていない。このことに関して米Cnetが同社に問い合わせたところ、6,323人のうちデータを回復できたのは70%だったという回答が返ってきたという。ということは2000人弱のユーザーは、一部データを回復できなかったということになる。

 この障害に関して取り上げるメディアは米国でもほとんどなく、米国版Google Newsで検索したところ見つかったのは、前出のCnetの記事とThe Next Webの記事の二本だけだった。

 The Next Webの記事は、結論としてEvernoteの対応を高く評価、問題発生時にはEvernoteを真似て、問題を修復し個別対応し、何らかのメリットを提供すべきだ、としている。

蛇足:オレはこう思う

障害に関する正式発表をこれまでしなかった理由は、影響を受けたユーザーへの対処を第一に考えたから、といいうこと。それは理解できる。正しい対応かもしれない。しかし、そうであるなら対応を終えた時点で発表してもよかったのではないだろうか。障害発生から1ヶ月以上たっている。いまだに影響を受けたユーザー対応に忙殺されているのだろうか。
発表文の中に以下の文章が入っていた。
We are posting this now because of erroneous information that we’ve seen popping up on the web.
「ウェブ上に間違った情報が出始めたので、この文章を掲載しました」
間違った情報って、どのことを指しているのだろうか。「間違った情報が出始め」ないと、正式発表しないつもりだったのだろうか。

という点が少々ひっかかった。

それ以外で、個人的に興味を持ったことが2点ほど。

1つは、2000人のデータを回復できなかったにも関わらず、同社に対する評価は非常に高いということ。クラウドサービスに対する信頼を損ねかねないような話だと思うが、英語圏で同社を批判する意見をこれまでまったく目にしていない。ユーザーは、クラウドサービスのデータ消失のリスクを十分に理解している、ということなのだろうか。それとも同社のソーシャルメディア対応が優れていて、ユーザーと長期的な信頼関係を築けているからなのだろうか。発表文の下につけられたコメント欄でも、同社を批判する内容はほとんどなく、同社の対応を絶賛するものが多い。Appleのアンテナ問題があった直後だけに、ユーザーやメディアの反応の極端な違いが興味深い。

Appleの対応のどこが問題で、Evernoteの対応のどこが優れていたのだろうか。Appleもメディアやブログが騒ぎ出す前にバンパーを無料配布しておけばよかったのだろうか。ソーシャルメディアマーケティングの観点から興味がある。

もう1つ興味深かったのが、ほとんど読まれていないTechWave Englishに記事を書いても英語圏のブログやメディアのアンテナにひっかかるんだなということ。米Cnetの記事は、「TechWaveが報じた」と明記してくれている。TechWaveの日本語版のほうのページランクが高いので英語圏のニュース・アグリゲート・サービスのアルゴリズムにひっかかるんだろうな、多分。

あと、カリフォルニアの山の奥で休暇中にも関わらず、iPhoneで長文のお返事をくださった外村さん、ありがとうございました。御社のそういった誠意ある対応が、ユーザーとの良好な関係を築く結果になっているのだと思います。

【追記】
日本語でも詳細の発表があったようです。

■7月1日のEvernoteサーバー問題に関して
8月 10th, 2010

過日米国時間7/1から7/4の間に弊社サーバ1台に2度続けて起こった異例のハードウェ
ア障害により約350万の全ユーザーのうち6323名がその影響を受け、上記期間中に新
規作成・編集したノートの一部が正常にEvernoteサーバーに記録できませんでした。

弊社CTOのDaveEngbergより、影響を受けたであろう全てのユーザーの方々にお詫びと
ご報告のメールをお送りするとともに、影響の有無を問わず、お使いのEvernoteアカ
ウントを今後1年間プレミアムアカウントにアップグレードさせて頂きました(既に
プレミアムアカウントをお使いの場合は現在のプレミアム期間の後1年間延長させて
頂きました)。

影響を受けた可能性があるのは全ユーザーの約0.2%以下の6323名で、弊社はサーバー
ログからそのユーザーの方々を100%全て把握しておりました。他の影響を受けておら
れないユーザーの方々からの問い合わせが溢れるのを危惧し、実際に影響を受け不具
合にお悩みの方々を徹底的にサポートし問題解決に尽力するために公のコメントを控
えた次第です。

7月初旬にEvernoteからEメールを受け取っていなければ今回の問題の影響はありませ
んのでご安心下さい。ローカル側のお使いのPCに保存されたノートデータのコピー、
Eメールやブラウザの履歴などEvernoteには複数のバックアップアプローチがあり、
実際に影響を受けたユーザーの大多数の方々は全ノートデータを回復することができ
ました。

本問題は一時的なものであり、二度とこのような事態が起こらないようトラブルレ
ポート・バックアップ用インフラシステムを以前よりも遥かに強化致しました。今回
の問題の影響をお受けになったユーザーの方々には改めまして深くお詫び申し上げま
す。また6323名の方々全員がデータを失ったわけではなく、ほとんどのユーザーの方
は全くデータを紛失していなかったのですが、今一度、長文でで申し訳ありません
が、当該の4日間で新規作成・編集されたノートデータの回復手段等も詳細に記され
ていますので、7月初旬にお送りしたEメールをご覧下さい。

影響を受けたユーザーの方々から多くの連絡が届き、Evernoteへの皆様へご理解と変
わらぬご支援に心より感謝しております。

■本トラブルの技術的詳細
各ユーザーのデータは、通常サーバーと障害迂回用サーバーで構成された『Shard
(シャード)』内に保存されております。通常サーバーに不具合が生じた場合、シス
テムは自動的にシャード内の2台目のサーバーに迂回します。現在弊社は37セットの
シャードを管理しており、シャード22に先月不具合が生じました。

各サーバー内のデータは、RAID1配列(完全冗長化対応)内に保存され、また全デー
タはオンサイト・オフサイト両方でバックアップされております。ノートデータのコ
ピーは全てEvernotefor Windows/Macクライアント上に保存されています
(プレミアムユーザーの方々はオフラインデータをiPhone/iPadクライアントで保存
しております)。つまり、Evernote内の全ノートは少なくとも6ヵ所の予備ロケー
ション(メインサーバーとそのRAIDミラー、シャード内の障害迂回用サーバーとその
RAIDミラー、そしてオンサイト・オフサイトのバックアップ)で保存されており、
Evernoteにおけるデータ紛失は極めて稀であります。

シャード22の不具合は、メインサーバーと障害迂回用システムにハードウェア
トラブルが重なった非常に特異かつ一時的なケースです。基本的に、各シャードは
一定時間で2台のサーバー間の障害迂回処理を双方向で続けており、その時間内に
作成されたノートの上書き作業を行っています。本トラブル以前に作成されたデータ
は全てバックアップ側から容易に回復させることができます。本不具合が再度連続し
て起こる確率は極めて低いのですが、万が一の最悪のシナリオとして全データが紛失す
ることの無いよう、障害迂回用メカニズムを適宜修正しました。

Phil Libin, CEO at Evernote Corporation

■ 弊社CEO Phil Libinより、本トラブルに関して皆様へのメッセージ(英語原文)

http://blog.evernote.com/2010/08/09/july1/

■ 同期不具合に関する解決方法

具体的な同期不具合の解決手順に関しては、
下記Evernoteフォーラム内FAQに用意しておりますのでご確認下さいませ。

http://forum.evernote.com/phpbb/viewtopic.php?f=55&t=17811

■1対1のユーザーサポート

現在ご不明点をお持ちの各ユーザーのサポートリクエストページからのお問合わせに
は、1対1でお答えしております。

http://www.evernote.com/about/intl/jp/contact/support/#inquiry

■ トラブルやメンテナンス情報の配信

トラブル発生・定期メンテナンス情報をユーザーに公開するEvernote Statusという
ページもご用意致しました。

http://status.evernote.com/

またEvernoteの日本法人の方からも以下のようなメールをいただきました。

CNetの記事(http://news.cnet.com/8301-27076_3-20013093-248.html)で言及されている
パーセンテージの数値に関して、
約70%のユーザーはデータ回復したと記載されておりますが、
これは残り30%のユーザーの方々全員のデータが一部失われたというわけではなく、
70%のユーザーの方々のデータは全て回復することができ、
残り30%のユーザーがきちんとデータを回復できたか否かまだ弊社側で判断できない、
ということですので、
決して本影響を受けたユーザー中の30%が全員データ紛失しているわけではないということを
まず湯川様にご連絡させて頂きました。

また別の担当者からは以下のようなメールが来ました。

サーバー経由で回復されなかった30%に関しましては
EN社に寄せられる反響からみても、ローカル上での
同期で回復された方も多いように推察できます。

この件に関する言及はこれで終わりになると思うけど、個人的に一番興味深かったのが、Twitter上で愛されているキャラが広報を担当すると、こうなるんだということ。日本におけるソーシャルメディア広報の事例を見せていただきました。ソーシャルメディアの力ってやっぱすごい。

【関連記事】
毎日新聞が「evernoteが7000人のデータ消失」と報道=だれか追加情報ください【湯川】 : TechWave
Japanese paper reported Evernote lost 7000 users data : TechWave English