Dec. 2020No.90

NII20年の軌跡とこれから国立情報学研究所 20周年記念特別号

NII Today 第90号

Interview

NII20年のあゆみと未来の情報学の役割

データ駆動科学を支え、社会課題を解決するために

今年、設立20周年を迎えた国立情報学研究所(NII)は、情報学の基礎研究から社会課題の解決につながる実践的な研究まで幅広く推進すると同時に、大学共同利用機関として研究・教育活動に必要な最先端の情報基盤を提供するユニークな研究機関だ。2013年の所長就任以来、DX(デジタル・トランスフォーメーション)時代の到来に先駆け、基盤構築に尽力してきた喜連川優所長に、NIIの役割の変遷と現在の活動、これからの情報学の役割、NIIがめざすべき姿について聞いた。

喜連川 優

Masaru Kitsuregawa

国立情報学研究所 所長

滝田 恭子

聞き手Kyoko Takita

読売新聞東京本社 メディア局次長兼オンライン部長
1989年上智大学外国語学部卒業、読売新聞社入社。2000年カリフォルニア大学バークレー校ジャーナリズム大学院修了。2002年より科学部で科学技術政策、IT、宇宙開発、災害などを担当。論説委員、科学部長、編集局次長を経て2020年より現職。

NIIに求められる役割を果たすために、学術ネットワーク「SINET」の付加価値化に挑む

─ 2000年に設立された NIIですが、前身は学術情報センターでした。もともとは図書館学の研究所という印象があります。

喜連川 1976年に発足した東京大学の情報図書館学研究センターが始まりです。本を何冊所蔵しているかというのが、大学のパワーだった時代がありました。たとえば当時、東大は確か800万冊ぐらい、京大が700万冊ほど所蔵していました。そうした状況で、必要な情報をいかに探し出すかというのは、非常に重要な仕事でした。そこが原点です。
 そして、80年代に入ってUNIXというオペレーティングシステムにTCP/IPがバンドル(※1)されまして、コンピュータがネットワークによって繋がるようになりました。その広がりにはそこそこ時間がかかりましたが、ネットワークは極めて重要なインフラとして認識されるようになってきたという流れがあります。大局的に見ますと、図書という知の情報の管理と、情報を流通するためのネットワークという2つの役割の重要性に着目してきたと言えます。
 すなわち、NIIは「図書館+学術情報ネットワーク(SINET)の構築・運用」を担ってきたというのが大きな流れです。学術情報センター所長から初代のNII所長になられた猪瀬博先生から、末松安晴先生、私の前任の坂内正夫先生に至るまで、歴代の所長は日本の学術ネットワークを大きく発展させました。ですから私も7年前に着任した時は、ネットワークを次にどう展開していこうかということを考えていました。

niitoday90_1-1.jpg

喜連川 優

─ 所長に就任された当初、NIIをどのようにご覧になっていましたか。

喜連川  ここに来るまで私は純粋に東大の研究者でした。あまり管理職的な仕事をしないですむ立場にずっとおりまして、どちらかと言いますと研究だけをやらせておいた方がいいだろうと思われているような人間でした。ところが、坂内所長から、「研究をしながら、ディレクターもやってください。その2つの側面をもつディレクターが、今後求められるだろうから...」と言われたんですね。坂内先生ご自身はNIIの前に東大生産技術研究所の所長をされていて、管理職から管理職に移られたわけですが、私の場合は教授から所長になることで、「研究をしながら管理職もする、新しい所長像をつくってください」ということだったのだと思います。
 正直言って、当初は大学共同利用機関のことも、研究所のこともあまり知りませんでした。でも、私が知らないということは、大学のほとんどの先生はNIIのことを知らないのだろうと思いました。ですから、自分が講演する時には必ず、最初に研究所の紹介をして、「NIIが学術情報通信ネットワークSINETを提供しているのですよ」と言っていました。そして、いろいろな大学の先生に会うたびに、「NIIはみなさんのために仕事をする大学共同利用機関です。何をしてほしいですか」と質問していました。
 その時に、ほぼすべての人がおっしゃったのがセキュリティの問題でした。ところが実際には、サイバーアタックから守るための研究をしている研究者は日本にはほとんどいないのが実情でした。
 家に泥棒が入った時は、悪いのは泥棒であって、管理をしっかりしていなかった家が悪いとは言われることはありませんね。でも、大学や研究所から何か情報が漏れたり、情報基盤に侵入されたりすると、世間からセキュリティが甘いと非難されるわけです。セキュリティを破られた方が被害者なのに、なぜか社会通念上、侵入されるような組織はダメだと言われるため、みんなびくびくしていました。何とかもうちょっとしっかり守ってくれないものだろうか、というような話を多く聞きました。
 まずはSINETの堅牢性を高めることが求められるなか、従来のようにネットワークを構築・運用するという段階から、そのネットワークに新しい機能を追加する、付加価値をつけて、みなさんの期待に応えていかないといけないのかなと、着任当初は、そうしたことをいろいろ考えていました。

niitoday90_1-2.png

NIIが構築・運用する「SINET5」
全国の大学や研究所を接続する超高速のバックボーンネットワーク。2019年12月に、東京ー大阪に 400Gbps回線が開通したほかは、すべての国内回線・国際回線を100Gbpsでつないでいる。海外学術ネットワークとの協働による大規模国際プロジェクトなど大規模なデータを扱う研究の支援のみならず、多様なサービスで研究・教育をサポートしている。

日本のセキュリティ研究を支える基盤として

─ 付加価値というのは具体的にはどういうことでしょうか。

喜連川 SINETは現在、約950の大学、研究所をつないでいるネットワークです。この仕事はもちろん非常に重要なのですが、ユーザーにとってはSINETでつながるのは、もはや当たり前のことになっています。そのうえに、みなさんが希望するようなサービスをさらに展開していく。そういう時代に必ずなるだろうという意識をもって、いろいろな人に話を聞きました。
 その1つで、最初に手がけたのが先程述べましたセキュリティです。24時間365日、大学や研究所を守る。それを実現できる人は誰だろうと考えたわけです。すでにいろいろなセキュリティベンダーがありますから、サービスを買うこともできますが、民間企業は情報の開示には慎重で、細かい情報を出してもらえない可能性があります。そこで本格的にやるには、自分たちでやるしかないと考えました。
 ネットワークに侵入してくるパターンや、マルウエアのようなウイルスの情報はとても貴重ですが、研究者はもっていません。こういった情報を大学でセキュリティ研究をするセキュリティの研究者と共有し、利用できるような環境を整えないと、人材も育てることができません。アメリカでもこの問題は結構深刻だと聞きました。
 そこで、セキュリティ研究をNIIで始めようと声をかけたのが、現在、サイバーセキュリティ研究開発センターでセンター長を務めている高倉弘喜教授です。高倉先生は名古屋大学にいらしたのですが、名古屋大学だけを守るよりもNIIに入って日本全体を守りませんか、と言ってお呼びしました。SINETは日本中で日々使われているネットワークですから、そこからウイルスを見つけてネットワークを守り、さらに学術に役立てる知見を得るのはたいへんなことですが、高倉先生の実力と頑張りで、現在は、レベルを商用のセキュリティサービスと遜色ないところまで引き上げることができています。
 一方、全国を100Gbpsの回線でつなぐネットワークなど世界でもほとんどありません。今、東京 - 大阪間は400Gbpsの回線で結んでおり、そのセキュリティを守ること自体がエキサイトメントでもあります。高倉先生をお招きして約5年になりますが、だいぶ安定して動くようになって、大学からは信頼される存在になりました。
 2020年の年末には、ここで得られたデータをようやく全国の大学に供給する予定です。セキュリティアタックのパターンのデータや、マルウェアなどを無毒化して提供していきます。
 NIIは大学共同利用機関ですから、各大学の声を聞きながら何をすればいいのかを一緒に考えています。予算についても、文部科学省にご理解をいただきながら、一歩一歩システムの整備を進めています。
 これから日本の中でいろいろ研究が進み、セキュリティの研究室や講座が各大学にどんどん増えていくことを願っています。工学系研究科や理学系研究科のなかに、太い柱としてサイバーセキュリティを専門に研究する場をもっとつくらなくてはならない。そのためのデータをNIIが提供し、人材育成をしていきたいと考えています。

クラウドサービスを使いやすくするために尽力

─ セキュリティ以外では、どのような付加価値を考えていらっしゃいますか。

喜連川 やはりクラウドサービスへの対応が必要だと思います。ただし、NII自身がクラウドサービスをするわけではありません。現在、クラウド基盤研究開発センター長を合田憲人教授が務めており、合田先生には既存のクラウドサービスを比較して、大学側にわかりやすく伝えることをお願いしています。
 クラウドの重要性については、私たちは早くから認識していました。アマゾンが始めた当時から、確実に世の中はこちらの方向に行くと見ていました。
 計算機自体はお金を出せば買えますが、いちばん難しいのはその運用です。何らかの原因でネットワークが切れてしまったり、電気が落ちてしまったりするなど、いろいろなことがあるわけで、誰かがずっとついて管理しなければならない。このコストがすごくかかります。一言で言うと、それがクラウドの本質的な価値です。
 大企業は自前で調達できても、中小企業は計算機を買っても面倒を見ることができません。それは教育機関も同様です。現在、国が進めている「GIGAスクール構想」で小学校、中学校にIT端末を配布しても、それらを接続するサーバーはどうすればいいか。何をどう調達すればいいのか、悩ましいですよね。大きな大学ならITを支援する情報基盤センターや情報処理センターがありますが、小さな大学や小学校、中学校には何もありません。
 一方、クラウドであれば管理をする人がいなくてもいいわけですから、その形になるのは当然でしょう。ただし、クラウドの仕様はさまざまです。たとえばデータをクラウドに置くところまでは無料でも、読み出す時に課金されるものもあります。ビジネスモデルが非常に複雑で、ITに慣れていない人が仕様を読んでも何のことかよくわからないのです。
 そこで、クラウドでわからないことがあったらNIIに聞いてください、と言っています。特定のクラウドを推薦することはしませんが、優位性や弱い部分などの特徴をまとめています。その際、クラウドのベンダーにも参加してもらい、みんなで議論しています。それによって、公平で健全な関係性が築かれていると考えています。ベンダーとユーザーがともに情報を開示しながら勉強会をすることで、Win-Winの関係が生まれるというわけです。
 クラウドサービスは使用頻度やサービスの数、契約日数などによって価格が変わるのですが、変わり方の傾斜がベンダーによって違います。ある時点ではここが安くても、2カ月くらいで別のところが安くなったりします。また、計算のためのデータをあるクラウドに入れてしまうと、別のクラウドには持ち出せないこともあります。これがいわゆる「ロックイン」と言われている問題です。ベンダー側としては、なるべく自分のところにデータを置いてもらうほうが得なのでしょうけれども、どれだけ容易に外に出すことができるかというような特徴も、クラウド基盤研究開発センターで比較して明らかにしています。

niitoday90_1-3.png

NIIでは、2016年にサイバーセキュリティ研究開発センターを設置し、サイバー攻撃に対し、国立大学法人等が迅速 にインシデントやアクシデントに対応できる体制構築の支援を行っている。さらに2017年から情報セキュリティ運 用連携サービス(NII Security Operation Collaboration Services: NII-SOCS)の運用を開始している。

niitoday90_1-4.jpg
データ駆動科学を支えるデータ基盤の構築を

─ NIIの主力事業であるSINETはこれからどのように進化していくのでしょうか。

喜連川 SINET5は2016年から運用しており、22年からは次のSINET6を展開することになります。SINET6はSINET5をさらにパワーアップし、全ネットワークを400Gbpsの回線で結び、さらに東京-大阪間はテラビット級をめざします。
 いままでのSINETとは大きく変わる点もあります。研究データを利活用するためのデータ基盤を構築する予定です。欧州はヨーロピアン・オープン・サイエンス・クラウド(EOSC)という構想に膨大な予算を付けています。研究成果をデータ基盤に入れておき、研究者がお互いにデータを共有することが自在にできる環境づくりを進めているのです。
 このデータ基盤にはまだお手本がありません。ヨーロッパもアメリカもいま、どんな姿がいいだろうかと懸命に考えているなか、日本も遅れることなくNIIの山地一禎教授が中心となって構築に着手しているのが現状です。

─ データ基盤の整備に、なぜいま世界が動いているのですか。

喜連川 科学の大きな流れの話をしましょう。最初は望遠鏡で空を見て、惑星がどのように回っているか観察をしていました。これが観察の科学です。
 次に、観察した結果から方程式を導出する理論科学の時代となりました。流体ならナビエストークス方程式、電磁気ですとマックスウェルの方程式というように、理論から方程式がつくられます。
 三番目は計算科学です。方程式をつくれても、実際にどのような挙動をするのかは計算をしてみないとわかりません。計算量が多い場合が多く、いわゆるスパコンの時代、すなわち、計算科学の時代へと変遷してゆくわけです。
 その次がデータ科学です。私たちは「データ駆動科学」、「データ・ドリブン・サイエンス」と言っていますが、この言葉は2009年ごろに「第4の科学」として出てきました。電気や流体のように根源的な方程式がわかっている物理領域とは異なる対象、たとえば人間の体や地球環境、これらについての方程式はありませんね。病気や自然災害などに対して科学が挑戦しなければならない時代になってきた現在、計算よりもデータに科学の基軸がシフトしているのです。これがデータ駆動科学です。
 ディープラーニング(深層学習)と呼ばれる技術が画像認識において高い性能を示したのが 2012年ですが、同じ年にアメリカのオバマ政権はビッグデータ研究開発イニシアティブを打ち出しました。AI(人工知能)も現状はディープラーニングが主で、山のように膨大なデータを入れてあげないと賢くなりません。データとAIとは両輪となって、両方で課題を解決する時代になってきたわけです。

医療や防災など社会課題の解決に向けて

─ 新型コロナウイルス感染症の診断でも情報が力を発揮したと聞きます。

喜連川 NIIでは日本医療研究開発機構(AMED)の研究事業において、医療画像のビッグデータ解析を日本医学放射線学会などと進めてきましたが、ここでめざす医療支援AIはデータがなければ動きません。アメリカではこれをData Fuels AIと言います。AIの燃料はデータである、ということを意味しています。自動車の燃料はガソリンです。ガソリンがないと自動車は動きません。同じように、データがないと深層学習を代表とするAIは動かないのです。つまり、AIはデータを見ながら勉強するわけですから、データがなければ何もできません。圧倒的にデータに価値がある。そのため、現在、6つの医学系学会とNIIをSINETで結び、医療画像のデータ収集に努めています。
 その結果、NIIの医療ビッグデータ研究センターには、CT画像を中心にすでに2億枚くらいの医療画像が蓄積されています。この仕組みが今回、新型コロナウイルス感染症の診断支援で奏功しました。
 3月ごろから CT画像でコロナ肺炎と思われるデータが送られてきて、現在では約700症例のコロナ肺炎の画像データが集まっています。大学病院からの CT画像が学会経由で NIIの医療ビッグデータ研究センターに送付される仕組みがつくられていたおかげで、圧倒的に速く、AIによる新型コロナ肺炎の自動診断システムを開発することができました。これはオープンプラットフォームで、その AIは名古屋大学の森健策教授のグループが開発されました。NIIはプラットフォームの開発と運営、アノテーションや開発した多様なツールの管理などをしています。NIIとしてはデータの基盤が重要だと確信し、少しずつ画像を集めていたわけですが、今回、実際に役に立つこと を示すことができました。

─ 地球環境分野では、データはどのように役に立っていますか。

喜連川 地球温暖化による災害の激甚化が、想定を超えるスピードで進んでいるのは、みなさんも感じておられる通りです。日本で頻発する水害に対しては、しっかりとしたデータを残すことが重要です。NIIでは北本朝展教授にも研究に入っていただいて、東京大学と一緒に、「地球環境情報プラットフォーム構築推進プログラム」において、データ統合・解析システム(DIAS)の開発を進めています。
 今年7月に熊本県を襲った豪雨災害では球磨川流域で多くの橋桁や家屋が流され、甚大な被害が出ました。こうした悲劇を繰り返さないために、いま、全国の河川に設置されている3000個ほどの監視カメラを活用したAIシステムの開発を手がけています。河川にはそれぞれ固有の特徴があるので、それらの情報も加味しながら、いつ危険な状態に達したかを、データをもとにAIが判断するようなシステムをつくり始めているところです。

─ データ駆動型に変化していくなかで、科学のあり方は変わっていくのでしょうか。

喜連川 私は2020年に起きた、いわゆる「ランセットゲート」は非常に深刻だと思っています。新型コロナウイルス感染症の治療に抗マラリア薬を使用することは安全性に懸念があるという論文が5月に世界的な医学誌『ランセット』に掲載されましたが、その根拠となっていた患者のデータに疑義が呈され、6月には論文が撤回されました。新型コロナに関しては、時間のかかる査読を経ずに多くの論文が公開されています。このこと自体は、過去も緊急時には行われてきたことで問題はありません。しかし、撤回された論文は、いったいどんなデータをもとにしているのかと聞かれた時に、結局、それを提示できませんでした。
 データ駆動科学の時代に医学や生命科学の領域において重要なのはデータをきっちりと管理して、エビデンスにすることです。何か疑義が生じた時にも、この時点ではこのような情報だったということを発信できるシステムをつくることは、サイエンスが健全に進んでいくために、最も重要な要素になると私は考えています。
 それからもう1つ、科学者と科学者のコミュニケーションも、実は言葉よりもデータでのコミュニケーションの方がいい面もあるのではないかと思っています。どんなデータを使ってこの論文を書いたのか、そのデータを見せてもらえば話が早い。分野が異なる研究者同士がデータをしっかりと見ながら咀嚼できるような基盤をつくることが非常に重要で、それによって新しい科学が進展する可能性があります。

niitoday90_1-5.png

左の写真は症状もなく、偶発的に見つかったCOVID-19肺炎の症例。特徴的なCTの所見から感染を疑い、その後PCR検査で陽性と判明した。CTはCOVID-19の診断に有用だといえる。ただし、CTでは病変を指摘できない症例や、右の写真の赤丸で示すように感染初期では変化が軽微で専門家でないと病変を指摘しにくい場合がある。このような人間では見つけにくい病変をAIが判別することが期待されている。(画像提供:順天堂大学医学部放射線医学教室・放射線診断学講座 明石敏昭 准教授)

社会実装と個人情報保護の壁を超えて

─ 学術の分野におけるNIIの役割についてお話いただいてきました。しかし、社会全体のデジタル化が進むなかで情報学には社会実装への要請も多く、民間企業と共同で進める研究もあるのではないかと思うのですが。

喜連川 企業との共同研究というのは、いわゆる寄付講座ですね。以前は国もNIIは大学共同利用機関なので、大学のために頑張ってくださいという雰囲気でしたが、だんだんと民間との共同研究もやってかまわない、さらには、積極的に産学連携をすべしと、流れが変わってきました。 
 そこで、2017年にLINE株式会社と共同研究の覚書を交わして、年間約1億円の研究費をいただいています。企業と共同研究をしている大学は多数ありますが、NIIの強みはすべての大学の情報系の先生方と仲良くしているという点にあります。企業側からしますと、どの大学のどの先生に指導を仰げば良いかを考えるのはたいへんな労力が必要となり、難しい作業となります。NIIはこの分野はどこの大学のどの先生と組むのがいいといったことをそれなりに把握していますので、非常に機動的にプロジェクトを組むことができます。LINEからの支援についても、さまざまな大学の先生方のプロジェクトをNIIがコーディネートしています。すなわち、大学をまたがった共同研究を企業と連携してつくりあげるという新しいフレームワークをデザインしてみました。このようなアプローチは共同利用機関では珍しく、順調に進んでいるところです。

─ 市民はデジタル化の利便性を享受する一方で、個人情報がどう扱われているかについて不安も抱いています。その点については、どのようにお考えですか。

喜連川 欧州連合は「一般データ保護規則(GDPR)」によって、個人情報保護を厳しく打ち出しています。先日、ドイツのカールスルーエ工科大学の先生がNIIの遠隔授業に関するシンポジウムで講演されましたが、「学生の面接試験を撮影したビデオも学生が要求すればすぐに消さなければならない」とおっしゃっていました。削除要求に対応できるシステムにしておかなければならないので、どのソフトウエアなら使用できるのかを把握しているとのことでした。
 個人の情報を大切にする意識が徐々に広がっていますし、そこをないがしろにしていたらビジネスも成立しなくなるという方向で動いていると思います。
 ただ、私は今回、新型コロナウイルスの感染状況を見て、「コロナの流行期間に限って、みなさんの情報をある程度いただけたら経済活動は圧倒的に早く再開できる。それなら個人情報を出しますか」という選択の問いを国民に対して投げかけることも一案ではないかと感じました。詳細な情報があれば、技術的には感染拡大の抑止をかなりの程度できるのではないかと思っています。

ゼロから考えて、未来を切り拓け

─ これからのDX時代において、情報学の研究者はどのような役割を果たしていくのでしょうか。展望をお聞かせください。

喜連川 今回、新型コロナウイルス感染症への対応で私たちが経験したのは、自分の専門技術や知識をどのように社会に役立てることができるのか、ゼロから考えましょうということだと思います。
 私自身のことを言えばNIIの所長として教育を止めないようにするには、いま何をすればいいのかを考えました。もともと ITの世界は動きが速くて、環境はすぐ激変します。だから、私たちは常に先を読んでいます。ですから3月には大学関係者を集めて、「4月からの遠隔授業に関するサイバーシンポジウム」を始めました。大きな国立大学では約5000の講義を1~2か月で遠隔授業に変える必要がありました。すなわち、学生も先生も、短時間に新しいシステムを使えるようになる必要がありました。
 近年の日本の政策は、大学同士を競争させて成果を出させようとしています。これもある程度は正しいと思いますが、コロナ禍でみんなが一丸とならなければいけないような時期に競争をしていたのでは非効率です。NIIは大学共同利用機関ですから、まずは旧帝大の7大学に呼びかけて、初めての試みなのでみんな少なからず失敗するのだから、お互いに失敗をどんどん開示して経験知を集めてほかの大学にも伝えていこうと決めました。それによって、日本の大学の授業の遠隔化は効率的に行うことができ、海外の主要大学に比べてまったく遅れをとらずにすんだのです。最近は、「4、5月にはたいへんお世話にななりました。ありがとうございました。お礼に現在の私たちの取り組みを紹介させて欲しい」と連絡が来ます。
 それぞれの研究者が、社会が何を望んでいるかを考えながら、一歩一歩進んでいく。自分が何をするかを具体的に考えざるを得ないなかで、たくましい学生や新しい研究が出てくることにより日本を変えていくことができるのではないでしょうか。

(写真=佐藤祐介)

(※1) バンドル:ある製品を別の製品に付随して提供すること。


 

インタビュアーからのひとこと

 データ駆動科学という「第4の科学」の勃興が、NIIの事業や研究を大きく広げようとしている。医療や防災分野の課題解決に、膨大なデータを解析する情報学の知見が役立っている点は頼もしい。基礎研究の蓄積をもとに、社会のニーズにどのように応えていくのか。図書館学からスタートし、時代の変化を取り込みながら日本の学術基盤を支えてきたNIIが、今後のオープンサイエンスの流れを捉えて、どのようなサービスを展開していくのかに注目している。

 

関連リンク
niitoday90_1-6.png
第90号の記事一覧