学際研究重点プログラム「ヨッタスケールデータの研究プラットフォームの構築」

学際領域の新しい研究による情報の「量」と「質」を共に扱う科学技術の開拓

図2  情報の量(横軸)と質(縦軸)との推移を示す模式図。図中の水平方向の情報量の拡大だけでは技術的に壁に当たる。情報の質を利用する 2 次元的な展開により知や知識を得ることができる。

図2  情報の量(横軸)と質(縦軸)との推移を示す模式図。図中の水平方向の情報量の拡大だけでは技術的に壁に当たる。情報の質を利用する 2 次元的な展開により知や知識を得ることができる。

 大容量情報を扱うときには情報の量だけでなくその質や価値がとても大事になります。必要のない情報は多いほどむしろ有害になります。私たちは日常無意識に情報に優先度をつけて価値のある必要な情報を区別して扱い不必要な情報は忘れてしまっています。もし、この情報の質と価値の判断をICT技術に用いることができれば、氾濫する情報をもっと上手に扱うことができるはずです。実際、情報は量だけでなく質の面も持っています。しかし、これまでのICT技術では情報の質を取り扱うことは難しいためにあまり顧みられることはなく、情報量によって定量化できる技術が用いられてきました。今後は巨大情報を情報の質や価値に応じて優先付けする(トリアージする)ことが必要になると考えられます。例えば、現在のストレージでは、直近にアクセスのあった情報は再びアクセスされる確率が高いことや一部の情報に多くのアクセスが集中する傾向を利用することなどの統計学的なシステム設計はされていますが、情報の価値をシステムが判断しているわけではありません。今後のヨッタスケールの巨大情報の山から目的の情報を効率的に探し出すために新しい情報質アルゴリズムを確立することが望ましいと考えられます。
 情報の質と価値の対応はしばしば個人や分野や目的などに大きく依存しており、現在の工学で取り扱うのは容易ではありません。知と知識を蓄積してきた人文社会科学との連携により情報の量と「質」の両面を扱う新しい科学技術を創出し、この巨大情報をトリアージして扱うことで大きな知識や知を引き出すことができるようにしたいと思っています。特に、これからの大きな発展が社会から期待されている、ビッグデータ、AI、IoT、セキュリティ、などのプラットフォームとして情報の「質」を踏まえる研究が重要と考えています。マイクロソフトの人工知能Tayがヒトラーを礼賛する発言をした事例がよく知られていますが、これから大きく発展する人工知能においてもそこで学習に用いる情報の質が大変重要なことは明らかです。情報の質や価値をシステムが提示することで人間の知的能力を適切にアシストし、巨大な情報からこれまでにない社会的価値を創出することを目指していきます。

Page Top