学際研究重点プログラム「ヨッタスケールデータの研究プラットフォームの構築」

 ヨッタと言うのは耳慣れない言葉ですが、10の24乗(1兆の1兆倍)という非常に大きな数量を示すSI単位系では最も大きい補助単位です。従って、標題のヨッタスケールデータとはそのように膨大な情報量を意味しています。私たちが扱う情報量は急速に増加しており近い将来にヨッタバイトに達するペースで増加しています。しかし、この情報量は余りに巨大でこれを扱うには新たな学際的な情報パラダイムが必要と考えられます。このたび、この巨大な情報量を扱う研究プラットフォームの構築に関する研究課題が東北大学学際研究重点プログラムに採択されました。この取り組みには文系と理系の8部局から26名の研究者の参加を得て文理連携の学際的に大きな広がりを持っています。以下にその概要を紹介させていただきます。


爆発する情報量と情報オーバーロード

図1 生成情報量の幾何級数的な年次推移。2020年までの統計を外挿すると2030年までに1ヨッタバイトに達する。

図1 生成情報量の幾何級数的な年次推移。2020年までの統計を外挿すると2030年までに1ヨッタバイトに達する。

 インターネットを基盤とするサイバー社会の進展によって、人類が生み出す情報量は幾何級数的な著しい増加を続けています。図1に示すように、2010年には全世界で生成された情報量は1ゼッタバイト(1021バイト。1兆バイトの十億倍。)を超え2020年には40ゼッタバイトに達するとする報告もあります1)。ICT技術のとどまることのない進歩を考えれば、ビッグデータと呼ばれるこの巨大情報量の増加は今後も続くと考えられます。現在のペースで増え続けるならば、人類が作り出すデータ量は2030年には2010年の千倍に相当する1ヨッタバイトに達すると推定されます。
 この情報量の急速な伸びはICT機器の進歩よりも速いペースで推移しており、すでに現在のICT技術の限界を超え始めています。既存データセンターは莫大な設備投資を続けておりながら情報のすべてをストレージすることは難しくなりつつあります。今後15年先にヨッタスケールに膨張した巨大なデジタル情報量を既存のICT技術の延長で取り扱うことは難しいと考えられます。生成される情報のすべてを伝送したり蓄積することはできなくなり、捨ててしまう情報があることを前提にする新しい情報処理とICT技術のパラダイムシフトが必要と考えられます。
 特に近年問題になっているのが情報オーバーロードです。A needle in a haystack(干し草の山の中の針一本)と言われるように、身の回りにある情報のうち役に立つのはごくわずかです。日常のEメールを処理する作業を考えると想像できると思いますが、情報量が増えることは必ずしもプラスではなく、不必要な情報の過剰は余計な手間や混乱を招いてかえって知的生産性を損ないます。アメリカではこの情報オーバーロードのために年間9000億ドルの経済へのコストが生じているとも言われています2)。インターネットに氾濫している情報には無責任な情報源から送信された信頼性の低い情報が含まれており、ウェブから無作為に探してきた情報に頼って重大な決定を行うのは危険なケースがあります。これは、現在のインターネットでは報道や放送とは異なって単なる“通信”によって情報が生み出されているために情報の品質が保証されていないためです。もちろん、情報量の増加に比例して価値の高い情報が増えていることも事実です。得られる情報は玉石混交であり、人間の知的能力が限られていることを考えると、多ければ多いほど予めの選別が必要ということになります。


1) THE DIGITAL UNIVERSE IN 2020 : Big Data, Bigger Digital Shadows, and Biggest Growth in the Far East(IDC 2012.12) http://www.emc.com/collateral/analyst-reports/idc-the-digital-universe-in-2020.pdf
2) Basex Report, “Intel’ s War On Information Overload : A Case Study”(August, 2009)

Page Top