文部科学省 未来社会実現のためのICT 基盤技術の研究開発「イノベーション創出を支える情報基盤強化のための新技術開発」高機能高可用性情報ストレージ基盤技術の開発

 クラウドやビッグデータなどを活用する最先端IT社会では5年で10倍とも言われる急激な増加を続ける膨大な情報を取り扱う技術が必須であり、情報ストレージ技術はその基盤を成すものです。特に、データセンター等ではその大部分をハードディスク装置やテープストレージなどの磁気を用いる高密度大容量の記録方式が用いられています。電気通信研究所では岩崎俊一名誉教授による垂直磁気記録を用いた高密度磁気記録などこれまでも大きな役割を果たしてきたところです。このたびの東日本大震災を踏まえて耐災害性の高いストレージ技術開発のために平成24年度より平成28年度までの5年間の計画で標記の委託研究を行っています。この技術開発のために、日立製作所並びに日立ソリューションズ東日本のご参加を得て、東北大学電気通信研究所(村岡、大堀教授、菅沼教授、中村准教授の各グループ)を中心にプロジェクトを構成して研究開発を行っています。ここではその概略を述べさせていただきたいと思います。

 東日本大震災においては多数の重要な情報が津波や建物損壊によるストレージ装置の被災によって喪失しました。従来からもストレージシステムはRAID技術やクラウド等に例示されるように情報の保全を重視して開発されてきました。しかし、東日本大震災のような広域甚大災害では、津波や建物損壊による直接的な装置喪失に加えて、ネットワークシステムの長期間の停止によって遠隔地に複製された情報へのアクセスが不可能となる事態を想定すべきことが示されました。被災地にあるオリジナルデータを保持するストレージ装置が損壊した場合、発災直後に最も必要となる住基情報や医療情報等の重要な公共データへのアクセスが困難であることも起こりました。このような拠点ごとの壊滅的な損壊や広域長時間通信途絶による被災にもデータを最大限保全するとともに途切れることなく情報アクセスが継続可能な高可用性を備えたストレージシステムの必要性が明確になりました。

図1

図1 津波をリスクと考えた際の複製先の選び方(複製数2の場合)

 このような背景を踏まえて、文科省委託事業プロジェクト「高機能高可用性情報ストレージ基盤技術の開発」では、先ず、建屋全体に及ぶ大規模装置損壊が起こってもデータの分散配置による情報保全が可能なシステム開発を行っています。並びに、広域通信網が途絶し被災地から遠隔地ストレージが利用できないような広域甚大災害時においては、近隣被災地域内でデータを互いに保護して継続した情報サービスを実現できるストレージシステム技術の開発に取り組んでいます。近隣拠点で情報を保管し合う場合には、同時被災リスクが高まるため、これを回避することが新たな課題となります。本プロジェクトでの開発目標には、災害に応じて各拠点のリスクを評価して近隣ながら同時被災の確立が低い組み合わせを選ぶ「リスクアウェア複製」方式を開発しました(図1)。たとえば、国や県、事業所、市内店舗などの複数のストレージ装置からなる地域分散型のストレージシステムにおいて、拠点間の距離や海岸からの距離が近いほうが危険と判断して危険度の推定を行い、より被災する可能性の低い拠点に自律的にバックアップデータを複製する技術です。これにより、大災害によってインターネットなどの広域網が途絶した場合でも、近隣のストレージ装置に残るデータを使って情報サービスを提供することができます。現在数理計画法を駆使して、本来膨大な組み合わせ数に昇る計算量を簡略化しながら最も情報を安全に保全できるシステム設計とその試作を通じて開発を行っているところです。 これまで、複数の拠点ストレージにデータを複製する基盤システムの実装と全体システムの連動テストを行い、実機を用いたリスクアウェア複製を実施しました。また、開発した高可用評価シミュレータを活用して想定するシステム規模である1000拠点程度のシミュレーション環境で、目標とする90%以上の可用性が実現できるかを検証し、仮想拠点を含む10拠点程度の基盤システムを第一次実証試験システムとして分散環境で構築し、同システムが、後述する投薬情報システムと連動して動作することを確認しました。

 さらに災害時には被災下での急激な緊急通信輻輳や少数の残存機器へのアクセス集中などのためにデータ転送速度の大幅な低下が生じ、情報ストレージ間の迅速なデータ通信が損なわれますので、各ストレージ装置からのデータ転送の高速化も求められます。データを同時並列で送信することで高速データ転送が可能なHDDの開発を行っています。このためにはストレージ機器自体のデータ転送の高速化を実現するとともに、併せてストレージ間のネットワークでの通信速度の向上も重要です。近年、ネットワークをソフトウェアで臨機応変に制御して常に伝送帯域を最大化できるSDN方式を用いて最適化アルゴリズムを検討しています。なお、このデータ転送の高速化は、平時においても昨今のトラフィックの急激な増加や高細精度映像などの拡大を続けるストレージ情報量の増大に対応するために求められています。

図2

図2 輻輳を動的に回避できるSDN による多重経路選択アルゴリズム不要なルート除去後に、残った経路からルーティング戦略に基づき複数経路を選択

 ディスク装置のデータトラックを同時に複数読み出すことで通常は強いクロストークのために情報が失われるのですが、これを防ぐことのできる2 次元符号化とその復号法を開発して複数トラックの加算信号からデータの分離を実現しています。一方、ネットワーク通信の高速化には、SDN(SoftwareDefined Network)方式をベースにして、複数チャンクを同時並列転送する際の経路選択アルゴリズムと制御手法、並びに経路多重化手法をOpenFlowのアーキテクチャに基づき、ネットワークシミュレータ上及び実機上に実装しました。本提案手法をネットワークシミュレータ上に実装し、適切な経路選択、経路多重化等により従来よりも高速化が実現可能であることを示しました(図2)。

 高機能化のために、電気通信研究所で開発された新たなプログラミングフレームワークSML#をアプリに用いるための研究に取り組んでいます。キーバリューストアと関係データベースの問い合わせとを系統的に実行できるプログラミング機能を設計しそのコンパイル方式を開発しています。具体的な目標としては、キーバリューストアに関しては、C言語等ですでに実装されているライブラリを調査し、汎用性がありかつSML#のCとの連携機能を生かせる実装が可能なシステムを目指した設計としています。関係データベースに関しては、アプリケーション構築のために十分に大きなSQL言語のサブセットを確定しそのSML#における構文を設計し、コンパイル方式を構築しているところです。さらに、投薬情報システムの必要な機能を検討・分析した結果、同システムをSML# にて開発する上で必要とされるものは、WEB アプリケーション開発機能であることが明らかとなったことを受けて、これまでに構築した型理論及びコンパイル方式のSML#コンパイラへの統合はプロトタイプの実装に止め、新たにSML# でWEB アプリケーションを開発するためのフレームワークの基礎理論研究を行なっています。

 以上の開発技術の耐災害性能力に対する総合的な検証として投薬情報システム(電子お薬手帳)の実験を行っています。東日本大震災では避難先で治療の際に投薬情報の有無は適切な治療の可否を決める重要な情報であったことに着目して、本研究開発で実現するストレージシステムの高い可用性を示す実証試験として「お薬手帳」の情報が災害等でも失われないことを実証することとしています。実証実験には仙台市規模のアクセスを想定した実験用投薬情報システムを開発中ですが、情報を受け取って開発する高可用ストレージと連携するサーバ側のWebアプリケーションと各ユーザの手許スマホ端末で動作するクライアント側のAndroidアプリケーションの双方を開発しています(図3)。東日本大震災での実態を踏まえたシステム仕様を策定して、内部データ構造や処理フローなどの詳細設計、プログラミング、および第一次実証試験を実施したところです。平常時および発災直後から一定期間にわたって10万ユーザが投薬情報システムを利用する状況を再現した上で、想定した災害シナリオにおいて半数の拠点が損壊しても90%以上のデータにアクセスできることを実証しました。また、実験結果を踏まえてシステム改善点を明確にし、高齢者など災害弱者の特徴反映等、より現実に近い条件下でストレージ基盤の実証をするための今後の実証試験仕様の修正点を明確にしています。

図3

図3 策定した大規模広域被災状況を考慮した実証試験シナリオ

Page Top