サイトアイコン TechWave(テックウェーブ)

スーパーコンピューター「京」の現在と未来、ビッグデータ解析性能のGRAPH500でぶっちぎり1位奪還 【@maskin】

 グラフ理論に基づくビッグデータ解析性能を競う「Graph 500」の運営委員会が2015年7月14日、半年に一度更新される最新ランキングを発表。理化学研究所のスーパーコンピューター「京」がダントツの性能差を付け首位を奪還した。2014年11月に「Squoia」が1位となったが「新手法のアイディアを出し、改良を実施」し1位奪還となったという。

 ビッグデータといえば、人工知能分野への注目などと相まって今年の流行語大賞なってもおかしくないレベルの重要ワード。現在のスーパーコンピューター「京」の置かれている今の状況と未来、そしてこの成果が、どんな事業にどう影響を及ぼすのかお伝えしたい。

TOP500とGRAPH500、ソフトと応用力で成長する「京」の今

 スーパーコンピューター「京」といえば、2009年11月の政府による事業仕分けや、パートナー企業の徹底(理研を中心に、富士通、NEC、日立 3社による共同プロジェクトだったが、その後、NECと日立が撤退)などによる数々の危機に見舞われたが、2011年6月には計算回数を競うTOP500で1位を獲得した。

 「京」のTOP500の順位は、それ以降、2位→3位→4位と落ち込んでいるが(http://top500.org/lists/2015/06/)、そもそもプロジェクトの目標は「1秒間に1京=10ペタフロップスを達成」することあったため、プロジェクトとしては性能計測すらしていない状態だという。

 「TOP500は20年以上継続しているベンチマークでスパコンのハードウエアの性能がベンチマークの結果に直結しており、ソフトウエアによる改良の余地が無くハードウエアの改良・増設等が無いと数値の向上が見込めないため「京」では2011年以来ベンチマークの計測を行っていません。

 現在スーパーコンピュータ「京」についてのハードウエアの改良・増設の計画は有りません。当初の開発目標であった計算性能10ペタフロップス(1秒間に1京回の計算が出来る能力)を達成しているため、それ以上の性能を求めていない計画的なものです」(理化学研究所計算科学研究機構 広報国際室 担当 岡田昭彦 氏)

 一部報道では「ずっと4位だ」とか「中国が1位」だとかあたかも競争に負けているというトーンで伝えられているが、そもそもこの領域では戦ってもいないというのが現実だ。

 一方、今回1位を奪還した「Graph500」については、グラフの幅優先探索(1秒間にグラフのたどった枝の数(Traversed Edges Per Second;TEPS))という不規則で
複雑な計算を処理し、その速度で評価されるもの。計算速度も不可欠だが、アルゴリズムなどプログラム全般の総合力が評価されるもの。理研 岡田氏は「ハードウエアの性能と共にアルゴリズムや性能の分析などの工夫によりベンチマークの数値の向上が望める発展途上なベンチマークであるためスパコンの性能を引き出す対応を継続して行っています」と説明する。要するに、「京」のハードウェア性能を最大限に活かす「ソフト面」での戦いとなっているのである。

GRAPH500トップ層の顔ぶれ
http://www.graph500.org/results_jul_2015

No. Rank Machine Installation Site Number of nodes Number of cores Problem scale GTEPS
1 1 K computer (Fujitsu – Custom) RIKEN Advanced Institute for Computational Science (AICS) 82944 663552 40 38621.4
2 2 DOE/NNSA/LLNL Sequoia (IBM – BlueGene/Q, Power BQC 16C 1.60 GHz) Lawrence Livermore National Laboratory 98304 1572864 41 23751
3 3 DOE/SC/Argonne National Laboratory Mira (IBM – BlueGene/Q, Power BQC 16C 1.60 GHz) Argonne National Laboratory 49152 786432 40 14982
4 4 JUQUEEN (IBM – BlueGene/Q, Power BQC 16C 1.60 GHz) Forschungszentrum Juelich (FZJ) 16384 262144 38 5848
5 5 Fermi (IBM – BlueGene/Q, Power BQC 16C 1.60 GHz) CINECA 8192 131072 37 2567
6 6 Tianhe-2 (MilkyWay-2) (National University of Defense Technology – MPP) Changsha, China 8192 196608 36 2061.48
7 7 Turing (IBM – BlueGene/Q, Power BQC 16C 1.60GHz) CNRS/IDRIS-GENCI 4096 65536 36 1427
8 7 Blue Joule (IBM – BlueGene/Q, Power BQC 16C 1.60 GHz) Science and Technology Facilities Council – Daresbury Laboratory 4096 65536 36 1427
9 7 DIRAC (IBM – BlueGene/Q, Power BQC 16C 1.60 GHz) University of Edinburgh 4096 65536 36 1427
10 7 Zumbrota (IBM – BlueGene/Q, Power BQC 16C 1.60 GHz) EDF R&D 4096 65536 36 1427

スパコン性能が世界を変える

 スーパーコンピューターへの期待は、身近なところでは「ゲリラ豪雨予測」といった気象や震災などの影響などの予測に活用することが考えられる。

 また、複雑かつ膨大なデータをシミュレートすることで製品開発にも応用することが可能。

 実際に住友ゴム工業が、スーパーコンピュータ「京」などを活用してタイヤの新材料開発技術「ADVANCED 4D NANO DESIGN」を2015年中に完成させようとしている。

 この技術は「ゴム中の分子レベルのミクロな破壊現象からマクロな摩耗現象を可視化すること」と可能にするもので、車のタイヤのゴム内部をシミュレーションして安全性はもちろん、燃費やブレーキの効き具合、ゴムの消耗具合などを判断する事ができる。

 住友ゴム工業では2011年に、独自の演算技術で製品開発「4D NANO DESIGN」で、実際の製品のブレーキ性能や寿命を向上させることに成功している。今回発表の技術は、これの進化版にあたる。

 2013年の京シンポジウムの講演「「京」を利用した大規模分子シミュレーションによるタイヤ材料の開発」では、スーパーコンピューターの性能向上が、これまでの壁を乗り越える機会創出につながると話している。 

高機能なゴム材料の開発には、ゴム内部のナノレベルの材料シミュレーション技術が必要となります。(ナノは10-9m で0.000000001メートルの大きさ) しかし企業レベルで保有しているスパコン性能では、大きさの規模(スケール)が違う材料同士をまとめてシミュレーションすることはできませんでした。

しかし「京」を使うと、サブナノレベル(10-9m未満)、ナノレベル(10-9m)、サブマイクロレベル(10-6m未満)にまたがる現象をまとめて、分子レベルで詳細なシミュレーションが行えます。ゴムの中の構造は不均質で偏りがありますが、これも考慮しながら、フィラー周辺の分子の動きや相互作用のシミュレーションを行いました。この結果、広範囲の規模(スケール)にまたがって現れる性能のメカニズムを解明できるようになりました。

ハード性能とソフト技術がつなぐ未来への期待

 単位時間計算処理回数が速ければその予測結果を出すことも速くなるわけだが、それが全てかというとそうではない。例えば、ゲリラ豪雨予測の世界では、センサーの高度化やそこから得られるデータと「京」から出てくるデータの活用という応用力が求められてくるという。

 理化学研究所 気象予報士 データ同化研究者 三好建正 氏による2014年3月に行われたTED Talk「ゲリラ豪雨を0.1秒単位で予測!? スパコン「京」の真価を発揮させる、「データ同化」のチカラとは?」(http://logmi.jp/21986PDF)ではこんなことを話している。

データは「京」コンピュータから出てくるデータと、新しい観測装置のレーダーから出てくるデータ。この1と1を足し合わせる、つなぎ合わせる、橋を架ける、それがデータ同化で、それによって個々では得られない新たな価値を生む。

 こうした「京」を活用した応用研究は、創薬(10種類以上の抗がん剤候補、リード化合物を発見)、パーキンソン病のモデル確立へ、人の心臓を精緻に再現、ウイルスの営みを分子レベルで解明、、台風発生の10日程度前から60%の確率で台風の発生を予測、発生の半日~1日前からの計算で高い確率で2012年7月の九州北部豪雨を予測自動車の空力、船体の推進抵抗、ファンの性能と騒音、超高精度シミュレーションなどなど多数の成果を産んでいる。

 直近では、第7回ドイツ・イノベーション・アワード「ゴットフリード・ワグネル賞2015」における革新的で応用志向型の研究に与えられる「エネルギーとインダストリー部門」で「京」が受賞。

 「京」を使ったリチウムイオン電池の理論計算研究が評価されたもので、理論計算の分野での受賞は始めてだという(「館山佳尚氏(物質・材料研究機構MANA)と袖山慶太郎氏(京大)が第 7 回ドイツ・イノベーション・アワード 「ゴットフリード・ワグネル賞 2015」を受賞 」)。こうった成果は、スーパーコンピューターが社会や自然、産業の課題解決に大きく貢献できることが認められつつあるということの証になるだろう。

 では、「京」をGraph500で1位を奪還した成果という切り口で評価すると、今後、どのような領域で応用力が発揮できると考えられるのだろうか、再び理化学研究所計算科学研究機構 広報国際室 担当 岡田昭彦 氏にご登場いただき、性能的にはまだまだ発展が期待できるという力強いコメントを頂戴した。

 「Graph500ではグラフの最も基本的な処理の速度を競うものとなっていますので、その性能を達成するために用いたソフトウェアやハードウェアはグラフの処理を行う様々な場面で活用できることが期待できます。

 グラフの利用場面として典型的な例としては、人や物の関係性、例えばSNS上での友人関係を表す場合に用いられますので、SNS上での関係をビジネスに用いる場合にその関係性を非常に高速に調べ上げることができることを意味します。

 性能的な優位性は特に大規模なグラフを扱う場合に活きてきます。例えば我々の手法を用いると通常であれば数時間や数日かかるようなグラフの処理が数秒といった桁違いに高速に処理できるようになりますので、リアルタイムにデータを解析してそれを瞬時にビジネスにつなげることができるようになると期待できます。

 こうした大規模グラフ解析においては、アルゴリズムおよびプログラムの開発・実装によって今回のように性能が飛躍的に向上する可能性を示しており、今後も更なる性能向上を目指していきます。また、上記で述べた実社会の課題解決および科学分野の基盤技術へ貢献すべく、スーパーコンピュータ上でさまざまな大規模グラフ解析アルゴリズムおよびプログラムを研究開発していきます」。

ポスト「京」、2020年に誕生へ

 「京」の次のスパコンとなるポスト「京」スパコンの開発が2020年を目標に始まっている。

 「エクサススケールコンピュータ」呼ばれるポスト「京」は、現「京」の
100倍性能(アプリケーション実行性能)を目指すというもので(「エクサスケール・スーパーコンピュータ開発の概要について」[PDF])、大規模・精密・複雑かつ長時間展開が必要な社会・科学課題を解決できるようにすることをミッションに掲げている。

 当然ながら、アメリカやEU、中国勢もこれらの動きに同調し競争は激化する見通しだ。特にアメリカ・EUは、同時期にエクサスケールコンピュータを実現する計画を立てている。

 ポスト「京」の予算は、およそ1400億円。国からは1100億円が拠出されるとのことだが、産業の競争力や社会的・科学的ブレークスルーへの貢献は大きく期待されていると言っていいだろう。



【関連URL】
・世界最高水準のスーパーコンピュータ「京」を運用する理化学研究所 計算科学研究機構のウェブサイト
http://www.aics.riken.jp/jp/
・京コンピュータ K computer (RIKEN AICS)
https://www.facebook.com/RIKEN.Kcomputer

蛇足:僕はこう思ったッス
例えば10年後、私達が住む日本はどうなっているだろう、高齢者の比率が激増し、これまでの働き方やビジネスの仕方では労働力不足に陥る可能性が高い。どんどん海外に出てキャッシュを産んでまだ帰ってくればいいという話もあるが、やはり何らかの優位性がなければそれも徒労に終わる可能性がある。

ではIT産業において、なにが重要でどういった方向性に歩むべきかを考えた時、「京」が達成している、ハードと、それを最大限に活用するソフトウェア、そしてそれを利用する企業が達成する応用技術。それらがひとつとなり圧倒的パフォーマンスを生んでいるという事実は、IT産業はもちろん、すべての日本国内産業にとって勇気を与えてくれるものだと思う。

日本のITスタートアップは、投資エコシステムが充実している北米カルチャーのコピーとして浸透拡大しているが、日本独自の技術ブレークスルーエコシステムのカルチャーに切り替えるべきではないか。今こそ、未来に対する本質的な成長にフォーカスすべきではないか。

モバイルバージョンを終了