ホーム > 資料の収集 > 科学技術情報整備審議会 > 議事録 > 第9回科学技術情報整備審議会議事録

第9回科学技術情報整備審議会議事録

日時:
平成29年7月25日(火)午後2時から午後4時まで
場所:
国立国会図書館東京本館 総務課第一会議室
出席者:
科学技術情報整備審議会委員 9名(欠席3名)
西尾章治郎委員長、竹内比呂也委員長代理、板倉康洋委員、喜連川優委員、倉田敬子委員、佐藤義則委員、戸山芳昭委員、藤垣裕子委員、村山泰啓委員
(石田徹委員、児玉敏雄委員、濵口道成委員は欠席。甲田彰科学技術振興機構理事が陪席。)
館側出席者 15名
館長、副館長、(幹事)総務部長、調査及び立法考査局長、収集書誌部長、利用者サービス部長、電子情報部長、関西館長、国際子ども図書館長、(陪席)総務部企画課長、総務部会計課長、収集書誌部主任司書、利用者サービス部サービス企画課長、(事務局)利用者サービス部科学技術・経済課長、電子情報部副部長電子情報企画課長事務取扱
会議次第:
  1. 開会
  2. 館長挨拶
  3. 新幹事紹介
  4. 報告及び懇談
    • (1)第四期国立国会図書館科学技術情報整備基本計画の進捗状況
    • (2)我が国におけるデジタルアーカイブ構築に向けた国立国会図書館の果たす役割
    • (3)懇談
      • 委員からの話題提供
      • 研究データと図書館との関わりの在り方
      • 我が国におけるデジタルコンテンツの長期保存の在り方・課題
  5. 閉会
配付資料:
(参考資料)
議事録:
1. 開会
西尾委員長:
ただいまから第9回科学技術情報整備審議会を開催します。 委員の皆様にはお忙しいところ、また大変暑い中を、当審議会に御出席くださり、誠にありがとうございます。本日は、12名の委員中9名の委員に御出席いただいていますので、定足数は満たされています。
竹内科学技術・経済課長:
本日は、石田徹委員、児玉敏雄委員、濵口道成委員が御欠席です。科学技術振興機構(以下「JST」)からは濵口委員の代わりに甲田理事に御陪席をいただいています。なお、板倉委員は、所用のため3時45分ごろ御退席の予定です。
2. 館長挨拶
羽入館長:
委員長を始め、皆様、大変暑い中、そしてまたお忙しい中、当館のために貴重なお時間をいただき、本当にありがとうございます。
前回は昨年の今頃でしたが、皆様に大変貴重な御提案、御意見をいただきまして、大変有り難く思っております。御提言を基に、昨年3月に「第四期国立国会図書館科学技術情報整備基本計画」を策定しました。それに基づいて業務をしてきましたが、その状況を今日、一部ではありますが、御報告したいと思っています。これについて、皆様の御意見をいただければ大変有り難く思います。周辺の状況としましては、今年の5月に知的財産戦略本部で「知的財産推進計画2017」が策定されました。また、6月には「未来投資戦略2017」が閣議決定されています。そこにも、分野横断型の統合ポータルの構築といったこととともに当館の名前が記されていることもありまして、今後、私どもとしましても、アーカイブ間の連携や利活用の促進に向けて、この基本計画に沿って進んで行きたいと考えています。
また今回は、大変な無理をお願いしまして、3名の委員の方々、板倉委員、竹内委員長代理、戸山委員が、今回の懇談テーマに沿った情報を御提供くださいます。お忙しいところ、どうもありがとうございます。
お手元にある当館の資料のうちの一つが、中期ビジョン「ユニバーサル・アクセス2020」のパンフレットです。この2020年というのは、前述した基本計画の最終年度に当たります。この基本計画と中期ビジョンの計画期間を合わせることによって、その次のステップに向かうことを意図しています。30年後には開館100年を迎えますが、その100年を目指して今なすべきことがあるのではないかと考えています。このような観点から、今日も皆様の忌憚のない御意見を賜りたく、よろしくお願い申し上げます。
3. 新幹事紹介
竹内科学技術・経済課長:
人事異動に伴い、幹事に異動がありましたので御報告します。坂田調査及び立法考査局長、小寺電子情報部長が前回の審議会以降に新たに幹事に任命されました。本日は、幹事のほかに、羽入館長、網野副館長、審議会事務局の職員も同席しています。どうぞよろしくお願いします。
4. 報告及び懇談
西尾委員長:
続いて、報告及び懇談に移ります。事務局が報告した後に、報告への質問をまとめて受け付けます。懇談は事務局の報告とそれへの質問が終わった後に行います。
(1)第四期国立国会図書館科学技術情報整備基本計画の進捗状況
竹内科学技術・経済課長:
(資料2に基づき説明)
(2)我が国におけるデジタルアーカイブ構築に向けた国立国会図書館の果たす役割
川鍋電子情報部副部長電子情報企画課長事務取扱:
(資料3に基づき説明)
西尾委員長:
この後の懇談では、事務局からの報告にあった二つの事項、「研究データと図書館との関わりの在り方」と「我が国におけるデジタルコンテンツの長期保存の在り方・課題」をテーマに議論していただきます。議論を始めるに当たっては3人の委員からテーマに関連した話題提供をしていただきます。懇談に入る前に、今の報告の内容について、御意見・御質問がある方は挙手をお願いします。
藤垣委員:
参考資料3の「国立国会図書館中期ビジョン」を見ますと、活動目標が「国会活動の補佐」、「資料・情報の収集・保存」、「情報資源の利用提供」と三つありますが、今の報告は活動目標2と3に焦点を当てたもので、活動目標1に関する動きがよく分かりませんでした。本当の意味での三権分立が成立するためには行政機関だけでなく国会議員がいろいろなことを調べて活動のベースとしなければいけませんので、活動目標1についても期待しています。
竹内科学技術・経済課長:
本日は第四期国立国会図書館科学技術情報整備基本計画に掲げられた事項に対する取組を中心に御報告しました。基本計画に掲げられていない立法調査業務については新しい取組に限って報告させていただいた次第です。
羽入館長:
三つの目標はそれぞれ分離しているわけではありませんので、資料が保存され、利活用できる状況になっているということが国会活動を補佐する基盤にもなっていると御理解いただければと思います。
倉田委員:
通しページ5に「他機関所蔵資料のデジタル化によるコレクションの拡充」とありましたが、これまでは国立国会図書館(以下「NDL」)の所蔵資料のデジタル化ということで進めてきたと思います。今後は所蔵資料以外のデジタル化にも積極的に乗り出すということでしょうか。つまり、学協会等のものでJSTや国立情報学研究所(以下「NII」)その他に載らないものはNDLがカバーしていくものと理解してよいのでしょうか。
川鍋電子情報部副部長電子情報企画課長事務取扱:
他機関所蔵資料のデジタル化によるコレクションの拡充は、まず、東京大学附属図書館の所蔵資料で1件目が始まりました。これについては今後どういった手続きで進めていくかを検討しているところです。積極的にやるのかという点については、当館で全てを集約するのは厳しいのですが、各機関で保存を担うのが困難な場合に当館が関与する用意はあります。最近の例としては、NIIのCiNiiで雑誌のフルテキストデータを持たなくなったものの一部を永続的に保存しています。
(3)懇談
西尾委員長:
続いて懇談に移ります。事務局からの報告の中で、NDLが課題として考えていることが二つ示されました。一つは、研究データと図書館との関わりの在り方について、もう一つは、我が国におけるデジタルコンテンツの長期保存の在り方についてです。これらの課題について、委員から関連した話題を提供していただいた後に、焦点を絞りながら懇談したいと思います。まずは板倉委員に、学術情報基盤整備の推進に向けた文部科学省の取組について、話題提供していただきます。
板倉委員:
資料4にありますように、学術情報基盤整備に関する政策としては、平成28年2月に、科学技術・学術審議会の学術情報委員会で取りまとめたものがあります。学術情報のオープン化の推進について検討した背景として、G7の枠組みでもオープンデータ、オープンアクセスに関心が集まっているということがありました。基本的な考え方は、学術研究の成果を人類の知的資産として原則公開し、広く社会で利活用されるようにしようということです。この考え方を研究者に基本理念として共有してもらうことが重要です。具体的には、公的研究資金による研究成果のうち、論文とそのエビデンスとしてのデータは原則公開すべきであるとしています。ただし、どのような様式で公開すべきか、あるいはどのような場合に非公開とするかについては、研究分野によって異なるところもありますので、研究コミュニティ等による検討を踏まえた対応が必要です。
次に、研究成果の公開について、基本的な方策を幾つか取りまとめています。まず、機関リポジトリの拡充などによる、論文のオープンアクセスについての取組です。続いて、論文のエビデンスとしての研究データの公開、研究成果の散逸等の防止、研究成果にデジタル識別子を付与して管理する仕組みを確立するということです。研究成果の利活用、人材育成も挙げています。また、研究データを的確に保存し活用していくための基盤整備も重要です。
昨年大隅良典先生がノーベル賞を取られたときに、我が国の基礎科学力が最近落ちてきているのではないかと警鐘を鳴らしていただいたこともあって、基礎科学力の強化に向けてどういう方策をとっていけばよいか、文部科学省の中にタスクフォースを作って検討を進めてきました。そこでも、研究成果の発信や研究活動の支援に必要となる研究情報基盤の整備が不可欠であるという方向性を出しています。直ちに取り組むべき事項として、オープンサイエンス推進のための研究データ基盤の整備、情報ネットワークの強化、電子ジャーナルの整備支援の拡充、電子ジャーナルプラットフォームの強化、計算環境の充実などを挙げています。
ここまで文部科学省の政策面について話しましたが、実際に学術情報基盤について活動していただいているのはNIIとJSTです。NIIは、日本全国の大学、研究機関等の学術情報ネットワークSINETの運用を始め、学術情報検索データベースCiNiiや、共用リポジトリサービスJAIRO Cloudによる学術情報の公開などを行っています。JSTは、国内電子ジャーナルプラットフォームJ-STAGEや国内研究者情報データベースresearchmap、科学技術情報総合検索データベースJ-GLOBALなどの事業を推進しています。
第9期学術情報委員会では、電子化の進展を踏まえた学術情報流通基盤の整備と大学図書館機能の強化が審議事項となっています。具体的には三つの観点があります。一つ目は学術情報流通に関する諸課題や基盤整備、つまりオープンアクセスにどう取り組んでいくかです。二つ目はコンテンツの電子化等を背景として大学図書館機能をどう強化していくかです。そして、三つ目は大学における情報基盤の強化で、SINETなどの学術情報基盤の強化・整備をどう進めていくかです。これらについて検討をお願いしているところです。
西尾委員長:
ありがとうございました。続いて竹内委員長代理から、電子化を踏まえた大学図書館の機能強化と国立国会図書館との連携可能性について、話題提供をお願いします。
竹内委員長代理:
資料5では、大学図書館の電子化がどのように進み、その結果NDLとどのような連携可能性があるかということについてまとめています。 最初に、電子化が日本よりも進んでいる北米の状況を紹介しますと、ジョージア工科大学のように資料費の97%が電子資料になっているというケースが出てきています。そこでは冊子体よりも電子情報の提供を中心としたサービスの構築が行われています。キャンパス内の情報サービス拠点の再編成に加え、図書館組織においても、アメリカでは比較的早い段階から「図書館員」という一般的な名称の職ではなく、より専門化された職名の図書館員を置くことが考えられてきましたが、最近では「データライブラリアン」という職名がはっきりと出てくるようになってきています。
我が国においては、先ほど板倉委員から紹介された学術情報委員会の審議まとめの、もう一つ前のまとめにおいて、教育・学修基盤としての大学図書館機能の強化という政策がまとめられ、それに基づいて短期間で進展がありました。このときは、ラーニングコモンズという形で学修・教育に適した大学図書館機能の強化が行われ、この動きが今日まで続いているという状況です。
ところで、大学図書館に影響を与えるのは、やはり出版・流通の電子化です。NDLの報告資料の中に学協会誌の電子化状況がありましたが、その数値を見て私はがく然としたと言わざるを得ません。私の資料でも「我が国の出版物の電子化は道半ば」と書きましたが、この遅れをどのように考えるのかは大きな問題です。一方で、外国からの資料はほぼ電子化されていますので、電子と紙を両方扱うという、中途半端な状況に置かれているわけでして、北米で見られるような電子化を前提とした大胆なサービスの再構築、ないしは組織の見直しに着手できないという状況にあります。
機関リポジトリについては順調な発展を遂げてきたと言えます。NIIのJAIROによれば現在650機関に機関リポジトリがあり、メタデータのみならずコンテンツを提供しているものは2百万件を超えています。元々機関リポジトリはオープンアクセス推進のために整備されてきましたが、今日の状況を見ると、当初考えられていたグリーンOAと言われる著者最終稿を機関リポジトリに公開することによってオープンアクセスを実現するのには限界があると言わざるを得ません。具体的な数値を言うと、我が国発で国際的なジャーナルに出ている論文の7%弱が機関リポジトリによってOA化されています。それに対して、ゴールドOAと言われる、オープンアクセスジャーナルによるOA化がそれを上回る勢いで進んでいます。千葉大学の昨年度のデータでは、既に15~20%になっています。そういった観点から考えると、機関リポジトリを従来のように単なるグリーンOAのプラットフォームと考えるのは十分でなく、オープンサイエンスの流れもありますので、研究データを含む多様な学術情報を搭載・蓄積・提供・保存していくためのデジタルアーカイビングを意識したプラットフォームとして機能強化していくことが強く求められているのではないかと思います。
我が国でも既に幾つも先進的な取組がありますが、例えば慶應義塾大学のメディアセンターデジタルコレクションなどに見られるように、IIIFに対応したデジタルアーカイブの構築が現在順調に進んでいると言えます。それによって、デジタルヒューマニティーズが目指しているような、デジタルを基盤とした新しい研究の展開が見えてくるだろうと思います。機関リポジトリでは識別子の付与が進んできていますし、オープンアクセスリポジトリ推進協会(JPCOAR)などのコミュニティ形成も進んできています。人的な面においては、リサーチ・アドミニストレーター(URA)と呼ばれる大学における研究支援職や教育・学修の支援専門職と図書館員が連携する動きも出てきました。研究データに関しては、例えば京都大学ではデータ科学イノベーション教育研究センターが設置されましたが、このセンターが図書館と連携する動きが具体化しつつあると伺っています。
このような動きがある中で、国立大学図書館協会は、昨年6月に「国立大学図書館協会ビジョン2020」を発表し、その中で「大学図書館の基本理念」をまとめました。ここで示される理念そのものは目新しいわけではないのですが、重点領域として「知の共有」、「知の創出」、「新しい人材」を挙げています。これらは今日の技術的環境、あるいは図書館・大学を取り巻く環境を踏まえつつ、基本理念を見失わない形で新しい対応をしていこうというものです。
その中で、NDLとは、まず、「知の共有」という部分で大きな関連を持つのではないでしょうか。連携の可能性と期待ということで言えば、知の共有基盤としてのディスカバリーサービスをどのような形で提供できるか、とりわけ日本語の資料に関するディスカバリーサービスの展開への期待は大きいと思います。ジャパンサーチやNDLサーチがうまく組み合わさって、各大学のデジタルアーカイブを含む日本の多様な学術コンテンツが発見でき、メタデータのみならず全文検索も可能であって、当然ながら利用可能なコンテンツについてはリンクをたどって見られるという環境の整備が重要ではないかと思っています。このような環境の整備は国内のみならず、世界の様々なレベルにおける日本への関心の喚起ということに関わると思います。メタデータも含めて、非日本語のインターフェイスをどう整備するかも重要になってきます。
次に、先ほど倉田委員から質問がありましたが、大学などで電子化されたものをNDLからサービスする可能性が考えられます。大学図書館が所蔵しているけれどもNDLが所蔵していない国内文献相当資料はかなりあるのではないかと推測しています。これが電子化され、NDLによる図書館送信サービスの対象となることは、文献提供という観点から新しいフェーズを開くことになるでしょう。資料にはあえて「ポスト“ILL”」と書きました。ILLは図書館相互協力に基づいて文献を複製したり郵送によって提供するものですが、実際の現場での作業は延々と続くもので、そのために消費されるリソースは大変に大きいものです。そういった形のサービスをこれからも続けていくのは非効率と言わざるを得ません。電子的な環境における効率的な文献提供のメカニズムの構築は、これからNDLと大学図書館界が協力して作っていく可能性のある領域でしょう。その際、グローバルな提供をいかに視野に入れるかも重要です。これについても、文化審議会の議論で図書館送信サービスの国際展開の可能性が見えてきたわけですが、早急な法改正を望むところです。
最後に保存の問題についてです。大学で機関リポジトリを中心に様々なものの電子化が進むと、機関リポジトリの中に、そこにしかないコンテンツが出てくることになります。もちろんサービスの第一義的な役割は大学図書館ないしは機関リポジトリが持つわけですが、これを永続的に保存していくにはどうするか。紙の資料なども併せて統合的に考えるべきものですが、例えばデジタルコンテンツに関しても、文献相当資料、あるいはそれ以外のものも含めてと言うべきかもしれませんが、永続的な保存機関としてはNDL、という機能分化ができる可能性があるのではないかと思います。
西尾委員長:
ありがとうございました。最後に、戸山委員から、国際医学情報センターの活動とデジタルコンテンツの保存・提供について、話題提供をお願いします。
戸山委員:
配布資料はありません。口頭で説明させていただきます。
信濃町の慶應義塾大学病院の敷地内にある北里記念医学図書館に医学情報センターという組織がありました。国際医学情報センター(以下「IMIC」)はそこを母体として1972年に発足し、2013年に一般財団法人化しました。国内外の高度な医学・医療情報を広く収集して、専門的に分析・評価し、有益な情報に加工した上で、製薬・医療機器企業や研究機関、個人研究者等へ提供することで、医学・医療水準の向上に寄与しようということで今日まで至っています。こぢんまりとした組織ですが、全ての職員を合わせると270名強になります。当初は複写やデータベース検索、翻訳などを行っていたのですが、2005年くらいから、医薬品の安全性情報の提供や、私どもで開発した文献情報統合管理システム「I-dis」の販売・運用、医薬文献情報をニーズに応じて加工・提供するということを主な事業としています。
また、医薬関連データベースを二つ作成して、インターネットで広く国民・市民にも公開しています。一つは医薬品の安全性情報をデータベース化した「国内医薬品安全性情報速報データベース(SELIMIC)」です。国内発行の医学雑誌650タイトルと年間3千5百冊の抄録・プログラムから毎年3万5千件程度の文献データを作成しており、現在の総文献数は26万点です。もう一つは「学会情報データベース」です。IMICで所蔵している講演集・抄録集・会議録、その他雑誌などに記載されている記事をデータベース化するとともに、学会の開催情報と学会基本情報なども収集して、毎年4千件程度のデータを作成しています。総データ数は10万件です。
ここからは、これに関連して現場でどういうことが問題になっているのか、現場の声をお聞きいただきたいのですが、まず1点目として、この審議会でも何度か話題に挙がったように、著作権に苦慮しています。基本的には著作権がクリアされた電子情報のみを保存することにしているのですが、その著作権の所在等を確認するのがなかなか難しく、権利者から利用目的に沿った許諾を取ることが大変な労力となっています。電子情報の保存を簡便に許諾できる仕組み、ルールの整備のスピードアップが望まれます。学会系の雑誌の著作権管理を行っている学術著作権協会に期待したいと思います。クリエイティブコモンズについて言えば、ライセンスごとの利用条件の違いが煩雑であって、学術情報の著作権処理にはどうも向いていないのではないかという意見が挙がっています。
2点目は、どの段階の電子情報を保存すべきかという、保存のタイミングの問題です。例えば、学会抄録を掲載した後で元のものが変更される場合があり、どの段階で保存すべきかを見極めるのが難しいという問題があります。次に、電子情報のフォーマットや媒体が多種多様で統一されていないために、情報収集や保存が煩雑だという問題があります。冊子体と電子情報で内容が違うという、扱いに悩むようなケースもあります。特に図表などを含むサプルメンタリー・データは電子ジャーナルのみに掲載されますが、それが増加傾向にあります。こうした情報をどのように取り扱うかも今後の問題点です。
最後に、情報を収集するに当たってウイルス感染のリスクが高まってきていることを、重要な問題として挙げておきます。
西尾委員長:
どうもありがとうございました。只今の3件の報告に対する質問もあると思いますが、これからの議論の中で適宜お願いします。
まずは研究データと図書館との関わりの在り方について議論したいと思います。事務局の報告の中で、研究データのメタデータを一元的に利活用できる仕組みの可能性や、インターネット上に公開された研究データをNDLが収集・保存する取組について紹介がありました。また、板倉委員の報告にありましたように、研究データの適切な保存と利活用を促進するための方策については、現在文部科学省の学術情報委員会でも議論されています。竹内委員長代理からは、オープンサイエンスの流れの中でコンテンツプラットフォームとして機関リポジトリの機能を強化する必要性と、大学発のデジタルコンテンツをNDLが永続的に保存することへの期待について報告がありました。研究データの収集・保存・提供において図書館がどのような役割を果たすことが求められるのか、また、大学・大学図書館、NII、JST、学協会、NDLの間でどのような役割分担が可能なのかなど、今後いろいろと考えていかなくてはならない問題があります。それについて、御意見・御提案をいただけますと有り難いです。
倉田委員:
研究データに関する重要な問題としてデジタルオブジェクト識別子(以下「DOI」)の付与がいろいろなところで進んでいると思いますが、国立国会図書館インターネット資料収集保存事業(以下「WARP」)で収集したデータにDOIを付与するというのはどのような仕組み・位置づけで理解すればよいのか、よく分かりませんでした。例えば、JSTのJ-STAGEに論文を出せばDOIが付与されるというのは分かりやすいですし、機関リポジトリの場合は、まだ試験段階ではありますが、論文が入ればDOIを付与するという仕組みがあります。ではWARPの場合は、収集したインターネットのサイトから採る研究データに付与するということなのでしょうか。これも試験的なものだということは分かっているのですが、今後も含めてどのように考えられているのでしょうか。
村山委員:
当事者側の一人としてお答えします。文献・論文に関してはJ-STAGEなどのプラットフォームに収集したり、出版社から出版したりするときにDOIを付与する、つまりDOIの登録申請やメタデータ管理をするメカニズムが既に実装されて動いていますが、研究データにはDOI等の登録や管理をするレイヤーとしての組織やワークフローがまだない、あるいは確立過程にあります。したがって、特に国内では多くの場合、研究機関など現場でDOIの登録を行っているというのが実情です。私のデータDOI登録事例を挙げていただきましたが、これは実験プロジェクトの一環として、私の研究室のチームが、NDLに収集された私たちのデータに対して、我々研究者自身がDOIを付与したという例です。NDLのWARPを保存プラットフォームとする場合に、識別子の登録・管理を学協会が担当するのか研究機関がやるのか、そういったビジネスモデルをどうするのかを考えるための基礎的な知見を収集するための最初の実験として行いました。
倉田委員:
そうしますと、これは研究機関がジャパンリンクセンター(以下「JaLC」)を通して登録したということでしょうか。
村山委員:
そうです。私たちがJaLCの会員になって登録しました。
小寺電子情報部長:
補足させていただきます。村山委員から御説明があったとおり、研究データに限らずDOIの付与は、基本的にはJaLCに登録している作成機関で行うという仕組みになっています。今後、仮にNDLがどういう形で貢献できるかという点につきましては、DOIのプレフィックスには機関名が入りますが、NDLのプレフィックスでよろしければ、NDLで付与していく可能性があるかと思います。もう一つの可能性としては、JaLCには正会員・準会員という区分があり、正会員の下で準会員がデータを登録する仕組みがあります。NDLは正会員です。せん越な表現かもしれませんが、JST又は機関リポジトリで拾えないようなところ、公的機関でも拾えない部分が大きくありますので、そこを正会員と準会員の仕組みの中で、NDLとの関係を組み立てていけるかもしれないと考えています。
佐藤委員:
プレフィックスを採ること自体は恒久的保存を意味するわけではないとDOIでは規定しているはずなので、DOIをNDLが付与すること自体は構わないと思います。ただし、データが他所に移ったときに、そのプレフィックスを使って移行先が運用するということになりますので、この問題は、誰が長期的に保存していくのかという問題に結びついてきます。例えば、どこかの学協会の代わりにNDLがDOIを付与して管理するということは、学協会又はNDLが責任を持って保存を担っていくという意思表明でもあるわけで、先ほど出たコンテンツの検索だけという話ではなく、コンテンツをどこにどうやって持つかという議論とも重ねてやっていかなくてはならないと思います。その辺りも含めた検討をお願いします。
西尾委員長:
NDLのミッションが膨らんでいきますが、実現可能性を十分に評価する必要があると思います。竹内委員長代理からは長期的な保存に関してはNDLにお願いできることが望ましいとの意見が出ていました。そのような方向性で今後検討願いたいということを、この審議会の意見として出せるのかという問題だと思いますが、いかがでしょうか。
佐藤委員:
ジャパンサーチのようにメタデータを集めてサービスするものとは若干変わってくる部分があります。竹内委員長代理の報告にあったように、大学図書館とNDLが連携して提供サービスを行っていくという方向性も視野に入れて、対象が研究データなのかドキュメントなのかという切り分けをしながら検討を進めていただければと思います。
竹内委員長代理:
私も参加している学術情報委員会でも議論しているところですが、個人の立場で発言させていただきます。研究データはどのタイミングで捕捉するかということが難しく、それ次第で誰がどうやるのかもおそらく決まってくるものと理解しています。千葉大学で教員に話を聞くと、研究が終わった後に、データマネジメントポリシーによって義務付けられた保存年限まで、機関リポジトリが受け皿となってきちんと保存してくれれば便利だと言う教員もいます。
もう一つ、研究のエビデンスとなるデータの公開という問題があります。この場合、公開されている論文との適切なリンクが必要です。公開が前提となりますので、研究が終わったデータをただ置いてアーカイブすることとは少しレベルが異なります。つまり、データの目的と公開のレベルや条件が複雑に絡まってきまして、基本的に公開するコンテンツを載せるものとして機関リポジトリを捉えていた従来の感覚からは大きく変わるだろうと見ています。そのような状況下で、機関リポジトリはおそらくアーカイビングする部分とコンテンツとして発信していく部分の両方を持つようになって行くわけですが、今後どんどんデータ量が増えていくことを考えると、第一次的なサービスを機関リポジトリが担うとしても、永続的な保存は、例えば、サービスの対象ではなく、圧縮されたダークアーカイブとして行うことも考えられるのではないかと思います。そのような形でNDLが永続的に保存するという状況をつくっていくことも十分あり得るのではないかと考えています。
喜連川委員:
IDを付けることそのものは、現時点ではおそらくそれほど大きなイシューではありません。国益を考えたときに一番問題なのは、リジェクトされた論文のデータです。論文を投稿するときにデータを付けないと受付けないということがほとんどのジャーナルで起こりつつあります。その論文が通ったらデータを公開するというので構わないのですが、落ちたらどうするのか。データだけが向こうに行くことになります。データだけでなく論文本体についても同様の問題が過去にもありました。データの集約場所を国外に置いてしまったときに、国としてきしみが出るのではないかということが、様々な分野で言われています。
そうするとデータリポジトリはどういう役割を果たすかというと、データを一時的に置いておく場所から完成したデータをオープンにするところまで、研究のプロセス、ワークフローそのものをサポートするものとして見ざるを得なくなってきます。これは、ITシステムそのものです。データ保存の観点から、切断面としてどこが一番リーズナブルかというと、先ほどから議論されているように、完全に永続的な領域という切断面は取れるので、そこの部分をNDLに担ってもらうという発想はかなり容易に出てきます。ところが、NDLの立場になって考えますと、完璧にコストセンターになってしまうのですね。プロフィットを生み出すセンターになり得ないところがあります。これを組織として見たときにやりやすいのか、やりにくいのかを考えると、頼む側はやりやすいのですが、頼まれる側は相当しんどいだろうというのが難しいところです。それが全体の構図です。
データリポジトリについては、NIIは物質・材料研究機構(NIMS)と連携して、オープンサイエンスのためのデータプラットフォームの構築を始めたところです。分野によって相当違ってきますので、高エネルギー物理とも連携してやろうとしています。いろいろな分野で少しずつ作る中で経験知を築きまして、こういう場で紹介したいと思っています。私の感覚では、これは1年2年では勝負がつかないかなと思います。比較的長丁場の闘いになるという印象です。
それからDOIの話をしますと、私は研究者として東京大学で「データ統合・解析システム(DIAS)」という地球環境のデータベースを作っているのですが、最近「このデータをDIASに入れてください、ついてはDOIも取って入れてください」というデマンドが出るようになってきました。そのときにDOIのプレフィックスがどこの機関になるかというのは、そもそも意識されていないからかもしれませんが、それにこだわる人は現時点ではいません。マイナンバーと同じようなもので、番号が付いているだけの話ですから、その番号にアイデンティティがあるとかいうほどのレベル感はまだないのではないかと思います。
それと、ジャパンサーチがややこしいですね。重要なのは、保存と検索は根源的に分けて考えるべきだということです。今日の最初の報告でもそこが不明瞭でした。J-STAGEは入れておくところで、探すところはCiNiiです。日本の学術文献については、このように二つの機能が分かれているのですが、それに対して、ジャパンサーチが一体何をするのかがよく分からない。ジャパンサーチはGoogleに勝てるのですか、という質問を知的財産戦略本部でしたのですが、内閣府の回答はよく分かりませんでした。検索サービスというのは無茶苦茶しんどいことで、Google検索は20年かかってようやくこなれてきているところもあるのですが、この深みにNDLが入るとなると、よほどのITスキルがないとしんどいかもしれません。いずれにしても、羽入館長にはNDLのITパワーとリテラシーを極限まで引っ張り上げていただくことを期待しています。
西尾委員長:
どこが永続的なデータ保存を担うのかについては、予算やスキル、マンパワーがないと到底できるものではありませんので、本日この場で方向性を決めるのは難しいと思います。プロダクティブなことが本当にできるのかとなると相当慎重に考えなくてはならないと思います。ただ、やはりどこかに、記録媒体の経年劣化のことなども含めたストラテジーを押さえて、国としてデータを長期保存する場所がないといけません。
喜連川委員:
NDLのシステムというよりも、日本の情報倉庫みたいなものをどう作っていくかということになってくるので、もう少し広いスコープの中で議論していくことではないかと思います。
村山委員:
ヨーロッパでは、デジタルシングルマーケットなど、経済や市民社会そのものをデジタル基盤の上で再構築しようという政策が進んでおり、Horizon 2020などの予算で何とかしたいという話があります。OECDが知識資本社会のレポートなどを出していますが、自然資源の枯渇や少子化つまり人的資源の枯渇などが心配される中で知識や情報が本質的な社会・経済の担い手になる可能性があるという意味では、デジタル化によるコスト増は社会として免れ得ないのですが、一方でこれからの人類社会はデジタル情報を蓄えることで新しい社会・経済を作って行かざるを得ないのではないかと言われています。そういう見方をすると、NDLになるかどうかは別として、デジタル情報の保存の主体は社会を支える基盤になります。それは、かつて高度経済成長期に鉄道や高速道路が担ってきた、重要な社会資本としての役割と同様の役割を担うデジタルデータ基盤が必要になるのではないか、ということです。また、道路は建設すれば50年くらいもつかもしれませんが、デジタル基盤は作って50年そのまま動き続けるわけではありませんからコスト構造も異なります。そういったことを含めて国民の理解を得ていくことが、国際社会の中での日本の立場上も重要だと思います。
竹内委員長代理:
ジャパンサーチはGoogleと勝負できるのかという問題は、確かに大きな視点としてあると思います。日本版Europeanaのようなものが出来上がることを前提として、それを横断的に検索するためのツールとしてジャパンサーチが想定されているのではないかというのが、私がこの資料を見たときに感じたことです。技術的にそのような可能性があるのか、あるいはGoogleのような一般的な検索エンジンと比べたときに優位性や存在価値をどう説明できるのかというところは考えなければいけないと思います。
喜連川委員:
NDLとしては、言葉に踊らされないように注意して、何を根源的にやるべきか、ということを原点から考えるのがよいのではないでしょうか。
西尾委員長:
先ほど喜連川委員が紹介されたように、DOIのプレフィックスにこだわる人はいないというのが実情であるならば、NDLがDOIを振るという積極的なアクションを起こしてもよいのではないかと思います。
データの永続的保存を今後どうするかという問題は、やはりもっと大きな枠組みで考えていくべきですが、一方でNDLがミッションとして持っているものについては着実に進めるべきだと思います。
羽入館長:
おそらくどこかが将来的なデータの保存の仕方とサーチの仕方を考えていかなければいけません。そこに一番近い立場にいるのはNDLではないかと思っていますが、NDLが全てできるかというと、予算や人材などいろいろなレベルの問題があります。しかし、どういう姿が国にとって望ましいかということをその都度発信していくことは、我々の重要な役割だと思っています。
藤垣委員:
研究データの保存と公開はイコールなのだろうかとずっと考えていました。例えば、板倉委員の説明の中では「原則公開」とされていましたが、原則公開ということは公開しない可能性もあるわけです。特許権や著作権への配慮がその原則に引っかかる理由ということでしたが、実は今大学で相当議論しているのは、防衛省からファンディングを受けた研究についてです。これも原則公開ではありますが、公開しない可能性もあるわけです。軍事関連の研究は通常、非公開性を特徴とします。だからこそ学術会議であれだけ議論したわけです。科研費の場合はよいのかもしれませんが、防衛省の研究助成の予算が2年前は3億円、去年は6億円、今年は110億円になって、その研究成果を公開するかどうかという話になったときに、あるところでは全てオープンにしなければいけないという議論をしていて、あるところではクローズドなものにしなければいけない研究を扱っているわけです。二つの異なる方向性の議論を学術情報委員会ではどのように整理しているのでしょうか。また、この話をNDLに関連づけて言うと、兵器開発に関わるものを含む軍事研究データは、現在は原則非公開だったとしても50年経てば貴重な資料になるわけですから、保存の問題にはNDLも関係するのではないかと思います。
西尾委員長:
学術情報委員会での議論は、国費を使った研究、つまり税金を投じた研究に関しては原則公開だが、公開することが国にとって利益を生まない場合には非公開として構わない、というものでした。その審議を行ったときは、軍事研究や科学技術のデュアルユースの問題については特段の議論はなかったものと記憶しています。
データの公開・非公開の問題は常につきまとう重要な問題です。国としてポリシーを持っていないと、例えば海外の研究機関から「あなたのところが持っているデータを見たい」と言われたときにどう判断すればよいのか現場が混乱しますので、そのように定めたわけです。
さらに、分野ごとに公開すべきもの、すべきではないものが違ってくるという問題については、日本学術会議の分野別委員会の中でこれまでに議論を深めておられます。例えば、天文学・宇宙関係のデータですと、半年間だけはその設備を持っている国がデータを外に出さずに自分のところだけで研究する特権を持っています。そして半年経った後は、そのデータを全世界にオープンにするということがもうデフォルトのルールとして決まっています。
次に、デジタルコンテンツの長期保存の在り方・課題についても、先ほどから意見が出ていますので、併せて議論していただければと思います。
先ほど事務局から、現在の環境では再生できないCDやDVD等のパッケージ系電子出版物の保存・提供をどうするか、という課題に直面しているという報告がありました。また、資源が限られる中で、NDLが所蔵する様々なデジタルコンテンツのうち、どれを優先して長期保存に取り組むべきか、また、保存技術の方向性はいかにあるべきかという問題提起もありました。これらの課題について、皆様から何らかの示唆がありましたら、是非お願いします。
小寺電子情報部長:
現状を説明しますと、資料3に「今読めるCD/DVD」「今読めないCD/DVD」などと書いてありますが、光ディスクは平成29年3月の時点で約76万9千点所蔵しています。光ディスクはおそらく10年ほどは読めますが、20年、30年となってくると保存状態が相当良くなければ危ないと言われています。現時点でどれくらい読めないものがあるのかというしっ皆調査は、かなりコストがかかりますのでできていませんが、媒体の劣化だけでなく、館内の利用環境を更新するたびに読めないものが増えていくという状況もあります。パッケージ系電子出版物の保存に向けた取組として、今年度から、一部のデータを吸い上げて別の媒体に移すということを試そうと、今準備を進めているところです。
喜連川委員:
以前、NDLがフランス国立視聴覚研究所(INA)の方を呼んで講演会を開いたことがありましたが、同研究所はこうした媒体を70年間持っているということで、カビが生えていたり、虫に食われていたりというスライドを見せてもらいました。東京大学でも35年くらい持っていますが、これは常にリヴァイズしています。読むのは当たり前で、読まないで置いておくという根性そのものが間違っているという考え方です。日本のベンダーがフェイスブックと連携して光ディスクを使ったアーカイブシステムを開発したというのも話題になっていますが、保存環境は大きな問題です。
それからエミュレーターの話ですが、昔のゲームをリプレイできないという話はもう延々とあります。こういうことだけを趣味のようにやっている人が結構世の中にはいますが、答えを出せたという話は未だに聞いたことがありません。
一番手っ取り早いのは税金のデータのやり方です。あの種のデータは無くすわけにはいかないので、社会保障系ですと年間三、四千億円くらいかけて、ずっとリード・ライトを繰り返しているわけです。銀行系がそういう意味では一番しっかりとしたデータの保存形態を持っています。一言で言うと、お金をかければできます。ではお金をかけずにどうすればいいかということですが、そんなことを言われても難しいでしょう。
村山委員:
International Conference on Digital Preservation(iPRES)という国際的な専門会議があったりしますから、やはり皆が悩んでいる課題ではないかと思います。今年は京都で開催されます。
西尾委員長:
利用頻度が低いデータはテープに保存して読込みに要する時間は許容し、利用頻度が高いデータはフラッシュメモリに記録するなど、階層性を持たせた保存システムもあります。対コストで考えざるを得ない状況だと思います。
喜連川委員:
アメリカはコロラドに穴を掘っているそうで、そうすると内部が恒温になります。湿度も全部コントロールされていて、アメリカは国家としてそういう情報の保存庫を作っているわけです。日本もそれくらいのレベルのことを考えなければいけないのかもしれません。しかしいずれにせよ、NDLがそれをやるのは重い話であって、そういうものを調達するという立場にならざるを得ないのではないかという気がします。
西尾委員長:
日本では、秩父山系に堅固な洪積砂れき層の基盤をもつ地震に強い地域があって、そこで磁気ディスクを保管する企業があります。それはさておき、問題はそういったことを外注するための予算をどう確保していくかということですが、これは国家の問題だと思います。そこは我々も応援しますので何とかその予算を引き出して、外注に出すべきでしょう。この問題をNDLの中で解決するとしたら専門のチームが必要なのではないでしょうか。
村山委員:
少し話が戻りますが、藤垣委員から保存と公開はイコールなのかという話がありました。大学が発信する学術情報として論文に加えてデータが重要だという認識が欧米でも広がるすう勢になっており、本腰を入れる大学や機関も出始めています。ただ、文献とデータでは扱い方が異なります。文献はレビューされて最終稿が脱稿する、というようにパブリッシュされるべき情報の定義が明確です。ところがデータは、最終版という定義がしづらく、またいろいろなバージョンが生成され得るなど、文献に比べてワークフローが不明確です。データパブリケーションという言葉がありますが、古典的なデータパブリケーションはただ出すだけでしたが、現在のデータパブリケーションでは、レビューを行うのか、ではデータのレビューとは一体何か、付帯情報のレビューはどうするのか、など新たな側面が問題になります。文部科学省で公開原則を出されたのは一つのエポックメイキングな事象だと思いますが、今後はどの種類のデータを出すのかに加えてどの状態やフェーズのデータを出すのか、分野や研究課題ごとに考えていく必要が生ずるでしょう。例えば宇宙関係の機関であれば「レベル3データになったら出します」などというように言うことができます。他の例では、地球観測データを研究する場合ですと、まずノイズだらけのオリジナルシグナルがあり、それにあるフィルターや処理をかけたら例えば、何かオゾン層のシグナルが出た、それを実際に地球全体のオゾンマップにする、といった各段階の作業とプロダクトがあります。この場合、どの段階のデータが本当に国民に残すべきものなのか、あるいは全てを残すべきなのか、そういったことを含めてデータを公開する作法が専門分野ごとに今後求められることになります。研究データ同盟(RDA)でEUの専門家から「理解できていないものを規制してはいけない」という発言がありましたが、各国ともそういう状況なのかなと思います。
喜連川委員:
問題はやはり、戸山委員の報告にもあった、現場が直面する著作権です。NDLは著作権法の制限規定があるので感覚が若干希薄なのかもしれませんが、大学では、例えば東京大学でも大学総合教育研究センターがある著作物を教材用に使おうとしたときに、誰の著作物かさっぱり分からないというような話が常にあります。これを制限規定に入れるという話なのか、フェアユースなのかというような話は、個人的には、何らかの形で議論を深めていかなくてはいけないと強く思うところです。
羽入館長:
NDLも、それと全く無関係なわけではありません。集めることに関して特例があるのであって、発信しないと意味がないわけですが、発信に関しては著作権法の規制の中にいます。したがって、NDLも同じなのではないかと思います。
西尾委員長:
本日出された問題や課題については、NDLとNIIとJSTで連携して取り組んでいただけると有り難く思います。
5. 閉会
西尾委員長:
議論は尽きませんが、時間になりました。委員の皆様には、貴重な意見の数々をいただきましたことを心より御礼申し上げます。この貴重な意見が、今後事業を展開する上でNDLの参考になればと思います。
(事務局から事務連絡)
西尾委員長:
それでは本日はこれにて閉会といたします。
(閉会)

このページの先頭へ