当文書は、「図書館Linked Dataインキュベータグループ最終報告書」(原文は英語)を日本語に翻訳したものです。
正式な文書はW3C のサイト上にある英語版であり、英語版はhttp://www.w3.org/2005/Incubator/lld/XGR-lld-20111025/で閲覧できます。最新版はhttp://www.w3.org/2005/Incubator/lld/XGR-lld/に掲載されています。
当文書には翻訳上の誤りが含まれている可能性があります。誤訳、誤植等のご指摘は、メールアドレス:standardizationまでご連絡ください。
翻訳者:国立国会図書館電子情報部電子情報流通課標準化推進係、国立国会図書館非常勤調査員 田辺浩介
公開日:2012年6月29日
翻訳もご覧ください。
Copyright © 2011 W3C® (MIT, ERCIM, Keio), All Rights Reserved. W3C liability, trademark and document use rules apply.
2010年5月に設立され、2011年8月まで継続したW3C図書館Linked Dataインキュベータグループは、図書館コミュニティまたはそれ以外において、セマンティックウェブ、とりわけLinked Dataの活動に関与する人々を集結し、既存の取組みの上に、将来に向けた協同作業の道筋を描くことによって、ウェブ上に存在する図書館データのグローバルな相互運用性の向上に資することを目的としている。Linked Dataにおいて、データは、オブジェクトの関係性を記述する「Resource Description Framework (RDF)」、「統一資源識別子 (URI、つまり「ウェブ上の所在場所」) 」といった標準を用いて表現される。
当グループは、小規模な独立プロジェクトから、国立図書館による取組みに至るまで、各種団体の関連する活動の報告を収集し、分析するところから開始している。これらのユースケースは、報告書本文に要約される内容の出発点となっている。つまり、図書館のLinked Dataの利点に関する分析、伝統的な図書館データに関する現在の問題点についての議論、既存の図書館におけるLinked Dataに対する取組み、図書館データに関する法的権利、そして次の段階に向けた勧告といった報告書本文の内容は、ユースケースに基づくものである。
この章は、刊行時点における当文書の状況を記述する。その他の文書が当文書を上書きしている可能性がある。インキュベータグループ最終報告の一覧が利用可能である。http://www.w3.org/TR/のW3C技術報告インデックスも参照のこと。
W3Cインキュベータ活動 の一環として当文書がW3Cから刊行されたことは、W3Cがいかなる内容について保証することも、W3Cが当文書で言及される問題に関して何らかのリソースを既に割り当てている、あるいは割り当てている最中である、または今後割り当てる予定であることも意味していない。インキュベータグループへの参加およびW3Cにおけるインキュベータグループ報告書の刊行は、W3Cメンバーシップ特典に基づくものである。
インキュベータグループは、W3C特許方針に規定されるとおり、利用料無料の原則のもとに成果物を制作することを目的としている。このインキュベータグループへの参加者は、後にW3C勧告に吸収されることになるインキュベータグループ報告書の一部に対し、W3C特許方針のライセンス要求に従って、各自のライセンスを提供することに合意している。
当文書では、図書館コミュニティと関連分野から選別したユースケースと事例研究を説明している。これは、様々な機関や個人から提供された情報をもとに、W3Cの図書館Linked Dataインキュベータグループが収集・分析したものである。事例は、以下に示すとおり、8つの主題による類型に区分されている。それぞれの類型から選んだユースケースについては、概要を掲載している。
当グループの憲章にあるとおり、W3C 図書館Linked Dataインキュベータグループの主な活動目的は、図書館と関連分野でセマンティックウェブ技術を実装した成功例を示すユースケースと事例研究を収集することである。アウトリーチや普及に関する取組みについても、画期的なユースケースとともに収集している。こうした事例は、図書館でLinked Dataの技術と方法を適用することによってもたらされる可能性と利点を示している。
この文書に提示したユースケースは、図書館が保有するリソースやその文脈の記述にLinked Data技術を適用することの潜在的な利点や、これらの記述を組織間または広く一般と共有することの価値を証明している。 このような記述には、リソース間の関係性を創出し、表現することが、まずは必要とされる。関係性は同様の実体を結び付けたり、既存の関係性をより明確にしたりすることによって規定される。新しい関係性は、機械処理(推論やマッチング等)、手作業(タグ付けや目録作業)のいずれかによって作成される。こうした関係性は、ブラウジングや検索サービスを通じて新たな発見を提供するために、また多様な情報源に由来するリソースを統合・集約するために使用することができる。集約は、データ管理における要となるものである。Linked Data技術は、メタデータ要素セットや値語彙の再利用、リソースへのURIの適用、APIのような提供サービスの開発を通じてグローバルな規模で図書館データの相互運用性を改善することができる。
ユースケース、事例研究、先進的な取組みやアイディアの集合は、8つの類型に区分される。
各類型に属する事例を収集し、確認した後、グループのメンバーによって、類型ごとの事例から一般的なシナリオが抽出された。ユースケースのシナリオを抽出したのは、元の事例の集合における主な考えを要約し、把握するためである。この文書で提示する抽出したユースケースは、各類型に関係する主題と状況の概要も把握できるものになっている。
以下の図は、ユースケースの組織化と前述した抽出のプロセスを示したものである。
この文書は、抽出したユースケース(4章)と事例ごとの要約(5章)を説明している。関心のある読者により詳細な情報を提供するために、類型と事例ごとの要約から、当グループが元の情報を収集整理するために使用してきたWikiのページにリンクさせている。
この類型は、書誌レコードに関連するユースケースを説明する。書誌レコードは、人間が利用できるように作られた情報オブジェクトの内容や特徴を記述するデータ要素のセットとして理解される。
元になったWikiページは、Cluster BibDataに掲載されている。このページは、当グループのメンバーによって作成され、当該類型に関するより詳細な情報を含んでいる。
標準的な要素セットを確立することにより、書誌レコードのセマンティクスを共通化する。
同一リソースに対する複数のレコードを一つのマスターレコードに統合する。これにより、エンドユーザーには、わずかな違いしか持たない複数の書誌レコードが表示される代わりに、多様な個別資料のレコードへのリンクを持つ、一つの書誌レコードが提示されることになる。
書誌レコードに関連するウェブリソースを特定し、標準的な語彙セットから選択した用語でタグ付けを行う。
一つに統合されたインターフェースを用いて、利用者がコンソーシアム内のすべてのリソースを検索でき、異なる基準によって表現されたすべての利用可能なリソースを利用者に提供できるようにする。
情報集約に関しては、三つの異なるシナリオがある。
エンドユーザーが検索された書誌レコードに注釈を加えることを可能にする。
事例名 | 概要 |
---|---|
書誌ネットワーク | Linked Data技術は、利用者の検索要件を支援するため、ウェブ標準を用いて、書誌レコードを情報のグラフとして表現することを可能にしている。 |
AGRIS | AGRIS(農業科学技術に関する国際情報システム)におけるLinked Data戦略は、農業科学分野にオープンなデータセットを作成し、データが持つ意味の豊かさを活用することに焦点を当てている。 |
コミュニティにおける情報サービス | コミュニティにおける情報サービスに対するLinked Dataのアプローチとして、データ提供にオープンライセンスを適用している。また、データの再利用を促し、情報収集と共有に参加する敷居を低くするために、オープンな標準を採用している。 |
BnF | Linked Data技術を適用することで、フランス国立図書館は、拡張性と相互運用性の高いデータモデルを用いて複数の情報源からデータを集約し、オンライン目録におけるリソース提供を改善している。 |
図書館レコードの識別と重複排除 | Linked Dataを図書館レコードに適用することによって、各知的生産物に対して一つのレコードだけが存在するように、図書館レコードを自動的にマッチングするためのアルゴリズム開発に役立つ。 |
LinkedDataと従来の図書館アプリケーション | 図書館の情報システムにLinked Dataアプリケーションを追加することで、既存のシステムにどのように新しいLinked Dataアプリケーションを適用させるかという課題をシステム設計者に示している。 |
過去の図書館データの移行 | 図書館は、セマンティックウェブ環境に今後出現するシステムやサービスを活用する、メタデータの一般共有と公益に寄与する等、いくつかの理由により、過去に作成したメタデータをRDFトリプルに変換することを望んでいる。 |
Open Library data | Open Libraryは、大規模な書誌データベースである。Linked Data技術は、Open Libraryのデータベースにおいて、特定の体現形レベルの情報を容易に参照することを可能にしている。 |
地域的カタログ | ドイツの地域図書館サービスからLinked Dataを提供することで、ドイツ総合目録がより簡易に作成できるようになる。 |
Pode | Podeのユースケースは、図書館データをRDFデータ、FRBR化したデータに変換し、Linked Open Dataのデータセットにおける個々のデータへのリンクを生成することに重点を置いている。 |
Polymath virtual library | Linked Dataを使用することによって、Polymath Virtual Library は、異なる情報源からのリンクを取得し、情報源の種別を共有するためのプロセスを改善するという点で、利益を受けている。 |
Talis Prism 3 | Talis Prism 3は、次世代OPAC、検索・発見用インターフェースである。Prism 3は、Talis Platformを実装している。Talis Platformとは、SPARQLによる検索と強力な全文検索機能を提供する、Linked Dataのホスティングサービスである。 |
元になったWikiページは、Cluster Authority dataに掲載されている。このページは、当グループのメンバーによって作成され、当該類型に関するより詳細な情報を含んでいる。
エンドユーザーは、Linked Dataとして表現された典拠ファイルを利用するシステムから恩恵を受けることができる。利用者が著者、著作のタイトル、キーワード等に関するメタデータを求めている場合、システムは、典拠ファイル、シソーラス、または統制語彙集から検索して、利用者が求めている可能性のある検索語をサジェストすることができる。サジェストされた値は、URIによって一意に識別される。これにより、システムは正確な検索をサポートし、使いやすさを向上し、レコードの重複といった問題を軽減することができる。
文書リポジトリは、Linked Dataとして提供された典拠レコードを使用することで検索機能を改善することができる。典拠レコードは、典拠コントロールされた実体の名称について、すべての異なる表記を一つにまとめる役割を果たしている。リンク付けされた典拠レコードを活用するシステムは、名称の異形を識別し、関連する書誌レコードなど、検索対象となる実体の典拠形に紐付くすべてのレコードにエンドユーザーを直接ナビゲートすることができる。したがって、検索結果はより完全なものとなる。加えて、こうしたシステムは、より適合性の高い検索語として、関連する用語をサジェストすることも可能である。
Linked Dataとして典拠データを提供することによって、各典拠レコードはURIによって一意に識別される。VIAFのようなシステムまたはイニシアティブは、同一実体に関して別の情報を提供するレコード間を関連付けることによって恩恵を受けることができる。これらは語彙マッピングの事例と同様の方法で、レコード間の意味的なリンクを生成している。これらの典拠データは、各集合をURIによって個別に識別した、集積したレコードとして提供することも可能である。 このようなアプローチは、参照すべき中心地点を提供することによって、自身の典拠レコードを他の協力者による情報とリンクすることを目指す機関に利点をもたらす。エンドユーザーの観点からすると、このアプローチは、様々な機関から来た情報を一つに集約することにより、利用者の経験をより豊かにする結果をもたらすことになる。
事例名 | 概要 |
---|---|
AuthorClaim | AuthorClaimの登録サービスは、研究者が執筆した著作に関するレコードと研究者情報をリンクすることを目的としている。このサービスでは、Linked Dataが、基本アプリケーションをさらに汎用化し、アプリケーション結果の再利用を促進するために使用されている。 |
典拠データの強化 | 典拠コントロールされたデータにLinked Dataを適用することで、コピーやマージをすることなく、外部のデータセットを再利用することが可能になっている。 |
FAO authority description concept scheme | URIを使用し、概念間に対応関係を設定することによって、FAOの典拠体系において、各概念の多言語表記を効率的に管理することができる。 |
International registry for authors | 著者の署名における非一貫性は、長年の問題になっている。IraLISは、この問題にアプローチするために、各著者に対して個別のURIを使用するなど、Linked Data技術を適用することを提唱している。 |
ドイツ国立図書館におけるLinkedDataサービス | Linked Dataは、ドイツ国立図書館における関連データを公開し、他の情報源とリンクするための最適な枠組みを提供している。 |
ヴァーチャル国際典拠ファイル (VIAF) | VIAFで用いているLinked Dataの手法は、国際的な典拠レコードにLinked Dataの原則をどのように適用するかについて、有益な経験と知識を提供している。 |
元になったWikiページは、Cluster VocAlignに掲載されている。このページは、当グループのメンバーによって作成され、当該類型に関するより詳細な情報を含んでいる。
強化と発見に関するユースケースは、マッピング作業に用いるソースや対象語彙を活用したコレクションに焦点を当てている。ここでは、以下を説明する。
語彙の強化と再利用は、他の値語彙を拡張するため、または新しい値語彙を作成する基盤作りとして行われる。
語彙マッピング用データを利用した主なサービスには、以下のものがある。
事例名 | 概要 |
---|---|
AGROVOC Thesaurus | SKOSを用いて概念体系のLinked Dataを提供することにより、FAOは他機関で維持管理される農業関係の語彙との等価関係を生成できる。 |
異なるシソーラスを用いたリポジトリにおける検索・閲覧 | Linked Dataを用いることによって、シソーラス間のリンクによるネットワークを形成し、他のシソーラスによってタグ付けされたリポジトリとの横断検索を可能にしている。 |
Civil War data 150 | アメリカ南北戦争に関するデータを集約し、南北戦争に特化したオントロジーと語彙のマッピングを行うことで、すべてのデータに対して一度に、特定の場所、連隊、戦い、将校に関する情報を検索することができる。 |
構成要素となる語彙 | Linked Dataは、メタデータ作成者が、米国議会図書館件名標目表(LCSH)のような既存の統制語彙集から選んだ用語のURIを利用することを可能にしている。 |
言語技術 | 名称実体の識別技術など、言語技術の応用に関連する問題への対応方法として、Linked Data技術とデータリソースを使用している。 |
主題検索 | Linked Dataの原則は、人間と機械の双方によるウェブ上のリソースの効率的な発見と再利用のために、図書館が件名標目システムを活用することを可能にする。 |
語彙結合 | Linked Data技術は、語彙のマッピングや結合の技術を通じて、語彙間の連携を促し、多言語から成るリソースの発見を可能にする。 |
OWLとUMLの連携 | UMLクラス図が、OWLオントロジーの検索、再利用、設計のために使用される。 |
元になったWikiページは、Cluster Archivesに掲載されている。このページは、当グループのメンバーによって作成され、当該類型に関するより詳細な情報を含んでいる。
アーカイブのグループは、所蔵に関する情報をより効率的に共有することを望んでいる。このグループは、それぞれ個別の目録を持っており、必ずしも同一のフォーマットを使用しているわけではない。Linked Data形式でアーカイブデータを出力し、共有することによって、メタデータに含まれる主題、個人名、地名やその他の情報を用いてコレクション間を関連付けることができるようになる。
アーカイブは、利用者により多くの発見をもたらすことを求めている。伝統的なデータベースの手法では、利用者は、アーカイブ資料の記述中で明らかにされる関連を辿ることができない。どのような検索を利用者が行うのか、どのような情報が有益であるか予測することは困難であるため、Linked Dataは、利用者がアーカイブのメタデータにおけるすべてのデータ要素から引き出される経路を辿って検索することを可能にしている。
アーカイブは、ウェブ上のリソースからその資料にリンクすることによって、自身の可視性を向上することを求めている。これは、Linked Data形式でメタデータを作成・提供し、Linked Dataのクラウドにそのメタデータを加えることによって可能になる。このシナリオでは、図書館、文書館、博物館から集めた多種多様な資料間での意味的なリンクの生成を促進することも期待されている。
保存作業を記録し、専門知識やコレクション情報を交換するために同種のメタデータを使用する機関間でネットワークを形成する。様々なメタデータフォーマットを使用して記述された多種多様なデータ間での相互運用性を促進し、向上させるために、セマンティックウェブ技術を使用する。これによって、より幅広い利用者層から、デジタル形式で保存された資料が利用されるようになる。
事例名 | 概要 |
---|---|
Archipel | Linked Dataとして表現された分野固有のメタデータ語彙やモデルが利用可能になり、語彙間のマッピングの質が向上することによって、Flemish Archipel Projectは恩恵を受けている。 |
デジタル保存 | Linked Dataは、保存メタデータの提供者間での労力の重複を削減しつつ、デジタルオブジェクトとその特性を記述するためのグローバルな環境を提供する。 |
Europeana | Linked Data技術によって、Europeanaは、メタデータモデル間の意味上の相互運用性を向上させ、既存のメタデータを強化し、オブジェクト間のリンクに関するデータの収集やオブジェクトの発見とアクセスに関する機能を改善している。 |
LOCAH | Linked Dataは、水平方向の検索による利点を拡張し、広く分散したリソース間でリンクを作成することによって、利用者が文脈上関連する資料を発見する一助となっている。 |
Photo museum | Linked Dataは、写真コレクションを記述する多種多様なデータによって生じる技術的な問題の効果的な解決法をもたらしている。 |
Radio station archive digitization | Linked Dataは、とりわけイベントに関するデータの相互参照を可能にすることによって、ラジオ放送関係資料のデジタル化プロセス に付加価値を与えている。 |
Recollection | Recollectionプロジェクトでは、米国議会図書館が主宰する全米デジタル情報基盤整備および保存プログラムの協力コミュニティが、コレクションとデータを継続的に共有できるようにすることを目的として、 Linked Data技術を用いたプラットフォームの提供を模索している。 |
カンタブリア文化遺産のオントロジー | Linked Dataとしてカンタブリア(スペインの北部地方)の遺跡に関するデータを公開することで、カンタブリアの文化遺産に関する相当量の情報がLinked Open Dataクラウドに提供されている。 |
元になったWikiページは、Cluster Citationsに掲載されている。このページは、当グループのメンバーによって作成され、当該類型に関するより詳細な情報を含んでいる。
引用された参考文献が、引用情報から直接アクセス可能な場合に、出版物に関するデータ表現を強化する。(例えば、引用先・引用元となる文書における位置、何を引用しているか等)
利用者は、クリックすると、引用情報から直接、参照先の出版物の該当箇所にアクセスできる。(URIまたはOpenURLのようなリゾルバーの仕組み)
当該著作への引用の内容(被リンク数、賛成・反対の表明)を分析することにより、簡易かつ自動的にリソースの価値を判定する。
「関連する著作」の章に含めるために、引用先のリソースが同一の、他の出版物を探し出す。(被リンク数、「拡張する」や「~に基づく」等の表明)
事例名 | 概要 |
---|---|
科学データセットの引用情報 | Linked Dataが、科学に関するデータセットをその根拠として使用した出版物にリンクするための標準的な方法を提供している。 |
強化された出版物 | Linked Dataを適用することにより、同種の研究資料のコレクションを作成し、研究をより比較可能でより透明性の高いものにすることができる。 |
学術的議論のマッピング | Bibliographicaプロジェクトは、思想や学術的な議論の発展を記述することで、著者と著作間の豊かな関係性を捉えることを目指している。Linked Data技術は、こうしたデータの表現を支援することができる。 |
元になったWikiページは、デジタルオブジェクトの類型に掲載されている。このページは、当グループのメンバーによって作成され、当該類型に関するより詳細な情報を含んでいる。
いくつかの観点から同類と見なせるウェブ上のリソースの集合をエンドユーザー側で定義することができる。リソース間に存在する関係性は、大抵の場合、不確定なものである。集合のうちのリソースのいくつかは、集合を定義する機関の管理下にない場合もある。
エンドユーザーは、関連する記述、人物、主題など、リソース間でリンクを生成することができる。例えば、デジタルテキストを集めたリポジトリにおいて、ある詩をウェブ上の他の場所で典拠ファイルとして定義した同一の詩にリンクすることができる。 粒度の細かいリンクは、文書の個々の用語のレベルにも設定することができる。
集合や集合に属するリソースを通じて利用者がブラウジングすることを支援する。内部リンクによって、エンドユーザーは、リソースの関連を探索することができるようになる。
リンク付けされたウェブの他の場所でも、メタデータの全体または一部を使って、利用者がコレクションの全体または一部を再利用できるようにすべきである。
事例名 | 概要 |
---|---|
Open Universityのコースに関連する資料収集 | Open UniversityにおけるLUCERO(Linking University Content for Education and Research Online)プロジェクトは、学生と研究者向けにリンク付けしたデータを公開するためにLinked Data技術と手法の調査とプロトタイプ開発を行っている。 |
デジタルテキストリポジトリ | Linked Dataを用いることで、デジタル形式のテキストを集めたリポジトリは、大量のメタデータや典拠データの提供者に各所蔵情報を記述してもらうことができるようになる。それにより、発見、選択、意味的なリンク付けの作業が促進される。 |
強化された出版物 | Linked Dataを適用することによって、同類の研究資料から構成されるコレクションを作成し、研究プロセスから論理的一貫性を引き出すことができる。結果として、研究はより比較可能で、透明性の高いものになる。 |
Editing Reports on New Academic Documents | Linked Data技術は、動的に変化する学習に関する分類システムの発達に寄与している。 |
NDNP (National Digital Newspaper Program) | Chronicling Americaは、利用者が250万以上のデジタル化したページを検索し、閲覧することができるウェブアプリケーションである。Linked Dataの原則は、Chronicling Americaの識別空間を設計するための基盤を与えている。 |
NLL digitized map archive | ラトビア国立図書館(NLL)の地図資料コレクションのデジタル版には、歴史的な地図資料の複製物が含まれている。地図資料のメタデータはLinked Dataで表現され、他のデータセットとのリンクによって強化されている。 |
Publishing 20th Century press archives | ドイツ経済学中央図書館の20世紀新聞アーカイブでは、OAI-OREにより集約され、RDFaで記述され、また他のデータセットとのリンクによって強化されたメタデータを提供している。 |
元になったWikiページは、コレクションの類型に掲載されている。このページは、当グループのメンバーによって作成され、当該類型に関するより詳細な情報を含んでいる。
個別資料のレベルの記述ではなく、コレクション全体に関するメタデータを提供する。物理的コレクション、電子的コレクションに拠らず、様々な機関が保有する、コレクションの範囲、特長、アクセス状況、連絡先の詳細等のコレクションに関する情報を、エンドユーザーがアクセスし、検索できるようにする。
ある情報リソースが見つかる最寄りの物理的コレクションの所在を特定するといった革新的なコレクション検索を可能にし、コレクションレベルの記述に基づくモバイル機器向けのアプリケーションを開発する。
コミュニティが特別な関心を持つコレクションを識別し、分類する。
事例名 | 概要 |
---|---|
AuthorClaim | AuthorClaim登録サービスは、執筆した著作に関するレコードと研究者をリンクすることを目的としている。基本アプリケーションをさらに汎用化し、アプリケーション結果の再利用を促すために、Linked Dataが使用されている。 |
コレクションレベルの記述 | 複数の多様な情報源に由来する、コレクションの記述をLinked Dataとして定義し、提供している。また、他のデータセットにもリンクしている。これにより、リッチで幅広いサービスが提供可能になっている。 |
コミュニティにおける情報サービス | コミュニティにおける情報サービスに対するLinked Dataのアプローチとして、データ提供にオープンライセンスを適用し、オープンな標準を採用している。これによって、データの再利用が促され、情報収集と共有に参加する敷居を低くしている。 |
アクセス制限付きのデジタルリソース | Linked Dataは、機関主体ではなく、利用者主体の電子情報リソースへのアクセスを可能にする。利用者個人の登録情報や図書館の権限に応じて、利用者が個別資料にアクセスできるかどうか決定する。 |
図書館の所在地データ | Hochschulbibliothekszentrum des Landes Nordrhein-Westfalen は、多様なLinked Dataのシナリオにおいて、リンク作成に使用できるように、図書館機関に関するLinked Dataのセットを提供している。 |
最寄りの物理的コレクション | Linked Data技術は、特定の資料とその地理位置情報を調べるために、図書館目録を用いてナビゲートする標準的で系統だった方法を提供している。 |
元になったWikiページは、Cluster Social Usesに掲載されている。このページは、当グループのメンバーによって作成され、当該類型に関するより詳細な情報を含んでいる。
分散型提供と集約は、ソーシャルなユースケースにとって根幹を成すものである。個人が起こす行動は、ドキュメントを公開するような場合には、より大きなコレクションを形成し、行動追跡をするような場合には、より良いレコメンド結果を提供するために集約される。
多くの場合、「ソーシャルな情報」は、関心事についての情報である。
a) 資料に基づく情報(貸出情報、目録記入等)、または資料に関する集約された情報
b) 利用者に基づく情報
b-1) 利用者の寄与による情報(コメント、書誌情報の記入等)
b-2) アプリケーション使用中に利用者の行動を通じて作成された行動情報(書籍を購入する、ウェブページを閲覧する等)。これは、資料に関連する利用者についての情報も含む。
全体に対する個人の貢献が、ソーシャルなユースケースにおける大きな特徴である。貢献のあり方は、不特定多数が共有サーバに投稿する「伝統的」なクラウドソーシングから、共有空間における多人数によるコラボレーション、またはコミュニティにおける情報サービスのユースケースのような、コミュニティに関係するリソースのキュレーションに至るまで、様々な形態をとり得る。
分散型提供と集約には類似性があるが、協同、公開のどちらに力点を置くか、観点に違いがある。
新しい利用法の多くは、機械可読形式データを必要している。機械可読形式データは、Linked Data、RDFa、マイクロフォーマットなど、様々なフォーマットで提供され、それらはアプリケーション・プログラミング・インタフェース(API)を通じて流通頒布されるかもしれない。
事例名 | 概要 |
---|---|
コミュニティにおける情報サービス | コミュニティにおける情報サービスに対するLinked Dataのアプローチとして、データ提供にオープンライセンスを適用している。また、データの再利用を促し、情報収集と共有に参加する敷居を低くするために、オープンな標準を採用している。 |
環境データと図書館データの相互リンク | ドイツ連邦環境庁(The Federal Environment Agency, Germany:UBA)は、図書館データを用いた分類システムにリンクするためにLinked Dataを使用している。 |
クラウドソーシングによる目録 | Linked Dataは、ボランティアが新しい書誌レコードを作成するとともに、書誌データを改善する手助けとなっている。 |
研究者と刊行物をリンクするためのMendeleyResearchNetworks | Linked Dataを用いて強化された関係性によって、Mendeleyの書誌情報管理ソフトウェアを使用する研究者は、他の研究者がMendeleyデータベースに提供した関連する研究をより発見できるようになっている。 |
Open Library data | Open Libraryは、大規模な書誌データベースである。Linked Data技術は、Open Libraryで、特定の体現形レベルの情報を容易に参照することを可能にしている。 |
貸出データを用いた人気度による検索結果のランキング | Linked Dataとして貸出データを提供することによって、検索結果における図書館資料のランキングを改善している。 |
SEO | 図書館目録から抽出した構造化データが、図書館データを検索しやすく、サーチエンジンで上位にランクされるようにするため、公開されている。 |
「この書籍を支持する」ボタン | 利用者がある書籍をパブリックドメインにするのを促進したいことを示すためにクリックできるボタンをウェブサイトに設けている。配信された情報は、Gluejarによって収集・集約され、Gluejarは書籍の利益に基づき、出版者と交渉を行う。 |
ソーシャルな注釈 | Linked Dataは、利用者が使用する情報に対して付加的なメタデータを記述し、提供することを可能にしている。 |
P2Pによる書籍貸借 | Linked Dataは、革新的で先進的なサービスの創出について調査をする手助けとなっている。 |
軽量アプリケーション開発のためのデータ公開 | 図書館データをLinked Dataとして公開することによって、第三者による軽量なアプリケーションの開発を促すことが可能になる。 |
ソーシャルなレコメンデーション | 図書館のオンライン目録は、資料の人気や利用者行動に関する利用可能な情報に基づいて、レコメンデーションや検索ランキングを利用者に提供することができる。 |
国際図書館連盟(IFLA)は、書誌レコードがどのような情報について提供することを目的としているか、利用者の要求に答えるという観点において、レコードが達成すべきこととして期待されるのは何であるか、明確で、厳密に記述された、一般に共有可能な理解を提供する枠組みの構築のために、書誌データの抜本的な再検証を主導してきた。加えて、IFLAでは、全国書誌作成機関が作成するレコードに対する基本機能のレベルや基本要件に関して、勧告を行うことを試みてきた。Linked Data技術は、データ、概念、そして、それらの関係性を情報グラフとして記述することを可能にする。ウェブ標準は、利用者の発見に対するニーズを満たすために利用することができる。
1975年以降、国際農業科学技術情報システム(AGRIS:International Information System for the Agricultural Sciences and Technology)のデータベースは、研究論文等の書誌的な参考情報を集約し、提供してきた。これらの参考情報は、会議、研究者、出版者、機関や主題に関するメタデータを含み、100カ国以上の150を超える機関によりデータ作成が行われている。AGRISにおけるLinked Dataの戦略は、2つの目標に焦点を当てている。一つ目は、農業科学分野におけるオープンなRDFデータセットを作成することによって、AGRISデータが持つ意味の豊かさを活用するLinked Dataの生産者としての地位を確立すること。二つ目は、AGRISのLinked Dataを公開することで、その他ウェブサービスがAGRISのデータを利用し、リンクできるようにすることである。
研究グループ、大学の学部、学術団体、特別利益団体等のように様々な規模の学術組織が、それぞれの分野の情報に対する注目や品質を維持し、情報をより広範な学術コミュニティや世間一般に広く公開することに強い関心を持っている。Linked Dataの手法は、こうした目的のために、再利用可能なオープンライセンスのデータを提供する。また、情報の収集整理と共有への参画に対する障壁を下げるAPIやデータ標準規格、クライアントソフトウェアをサポートする。
フランス国立図書館(Bibliothèque nationale de France : BnF)は、ウェブ上で利用可能な複数のリソースを作成している。Linked Data技術は、拡張可能で相互運用可能なデータモデルを用いて、複数の情報源からのデータを一つに統合することを可能にしている。それにより、オンラインカタログにおけるリソースの提供が改善され、ウェブ上の他の有益なリソースとのリンクができるようになる。
図書館分野におけるマッチングのためのアルゴリズムには、参照データが必要であるが、現時点では、そのようなデータへのアクセスが制限されている。Linked Dataを図書館レコードに適用することによって、図書館レコードの自動的なマッチングのアルゴリズム開発は促進されることになる。これにより、究極的には、一つのレコードが、一つの知的生産物に対してのみ存在するようになる。こうした状況下では、リソースのメタデータをより簡便に識別できるようになり、レコードの重複も排除される。
図書館の情報システムにLinked Dataアプリケーションを追加することで、既存のシステムにどのように新しいLinked Dataアプリケーションを適用するかという課題をシステム設計者に示している。この課題の背後には、どのように図書館が実験的なLinked Dataの適用から、図書館の情報システム全般へのLinked Dataの適用に移行するのかという大きな問題がある。
図書館は、セマンティックウェブ環境に今後出現するシステムやサービスを活用する、メタデータや同等のリソースの利用増加を促進する、メタデータの一般共有と公益に寄与する等、いくつかの理由により、過去に作成したメタデータをRDFトリプルに変換することを望んでいる。目標とするのは、伝統的な方法と革新的な方法の双方による利用を可能にするとともに、可能な限り、同等のデータ・有用性・意味を保持しながら、過去の図書館データをLinked Dataとして表現することである。この目標を達成するためには、Linked Dataとして利用可能な適切な語彙や要素セットのほか、共通のレガシーのメタデータフォーマットから、RDFクラスやプロパティへの安定したマッピングをコミュニティ全体で提供していくことが必要である。
Open Libraryは、およそ2,500万件の図書に対するメタデータを収録する大規模な書誌データベースである。100万件を超える電子書籍も、書誌データからリンクされる形で、当データベースに含まれている。目標とするのは、利用者が何の支障もなく、Open Library上のデータとリンクできるようにすることである。全文テキストとして利用可能な同一著作の体現形に関する情報を提供する、ある著作データに利用者がリンクできるようにすることが、その一例として挙げられる。
ドイツには、図書館が保有する全所蔵資料を収録する総合目録は存在しない。大学図書館は、地域的な連合体によって組織されており、構成員向けの総合目録が、一つの構成員によって管理されている。Linked Data技術を地域中心の図書館サービスに適用することによって、ドイツ総合目録をより簡便に作成することができるようになる。
Podeプロジェクトの目的は、図書館目録レコードにおけるデータを強化するために、技術と外部データを使用し、現在、図書館がウェブ上で提供する検索サービスでは利用できない情報や機能を持つエンドユーザー向けサービスを開発するためのプラットフォームを構築することである。このユースケースは、図書館データをRDF形式やFRBR化したデータに変換し、個々のインスタンスを他のLinked Open Dataのデータセットにリンク付けすることに焦点を当てている。
Polymath Virtual Libraryは、 スペイン人、ヒスパニック系アメリカ人、ブラジル人、ポルトガル人の全時代の博学者に関するデータ、デジタルテキスト、ウェブサイトの情報を一つに集約したものである。 このシステムの中心となるのは、著者である。Linked Dataを使用することで、Polymath Virtual Libraryは、様々な情報源からリンクを集め、増加する多くの情報源と相互作用することができるようになる。加えて、半自動的にデータを強化することを通じて、コレクションの効率性を高めること、Linked Open Dataとして利用可能なものからURIを取得すること、自身の可視性と利便性を向上するために、主としてHispanaやEuropeanaといったアグリゲータを通じて、Linked Open Dataとしてのデータ提供を行うことが可能になる。
Talis Prism 3は、次世代OPAC、検索・発見用インターフェースである。図書館が保有する、利用可能な膨大なコンテンツを検索するためには、機能の充実したインターフェースを提供する必要がある。著者、主題、シリーズといった実体ごとのブラウジング機能は重要であり、これは、MARC21から抽出した信頼性の高いデータをLinked Dataのモデルに変換することによって実現される。Prism 3は、Talis Platformを実装している。Talis Platformは、SPARQLによる検索と強力な全文検索機能を提供する、Linked Dataのホスティングサービスである。
AuthorClaimの登録サービスは、書誌データベースに記録された、研究者が執筆した著作に関するレコードと研究者情報をリンクすることを目的としている。このアプリケーションは、著者の識別に貢献することができる。このアプリケーションのシナリオでは、文書に対するメタデータは、主題作業の専門家によって分類される。各専門家は、文書がその分類に属すかどうかという二者択一の判断を行う。その結果として、文書のコレクションは、ある主題に関するレポートの集積を構成するようになる。Linked Dataは、基本アプリケーションをさらに汎用化し、アプリケーション結果の再利用を促進するために使用されている。
典拠コントロールとは、書誌的実体に対する典拠データの作成および維持管理に係る作業を指す。典拠コントロールにより、カタロガーは、同様または同一の特性を持つ資料を区別するとともに、論理的に同一集合に属する資料を集中することができる。Linked Dataは、コピーやマージの代わりにリンクをすることによって、外部データセットの再利用を可能にする。
FAO Authority Description Concept Schemeは、URIの利用と概念間の関係性の定義によって、複数の言語形を持つ概念の管理を効率的に行うことを目的としている。大量の検索結果を効率的に扱う検索システムを提供することも、Linked Dataの利点である。また、Linked Dataは、多種多様な実体の識別形式に一貫性を持たせることによって、情報へのアクセス性を劇的に向上させることになる。
科学情報の検索において最も重要なのは、著者の名前である。著者の表記形に一貫性がないことは長年にわたる問題になっているが、多数の研究者が研究書や論文を出版するにつれ、この問題の負の側面は大きくなっている。IraLISは、著者に常に同一の形で署名する必要性を自覚させるとともに、かつて使用した名前の異形を登録し、混乱を起こさない最適化された署名認識を可能にするIraLIS署名を生成する事業を行っている。IraLISは、Linked Data技術を使用して、各著者に対して特定のURIを付与している。
ドイツでは、典拠データは協同作業により集中的に管理されている。ドイツ国立図書館の書誌データと同様、典拠データも多くの図書館や文化遺産機関と関係を持っている。Linked Dataは、ドイツ国立図書館がこれらに関連するデータを提供し、その他情報源の対応するデータとリンク付けするための最適な枠組みを提供している。
VIAFプロジェクトは、典拠データを真に国際的なものとすることによって、言語の違いを超えた研究を可能にすることを目的としている。VIAFは、多くの機関から収集した典拠ファイルを単一の典拠データ提供サービスに統合している。2009年秋の時点では、VIAFに参加する15機関から収集した18の個人名典拠ファイルを収録している。VIAFで採用するLinked Dataのアプローチは、Linked Dataの原則を典拠レコードに適用する方法について、有益な経験と知識を示している。
ローマに本部を持つ国連機関である国際連合食糧農業機関(FAO)が維持管理するAGROVOCシソーラスは、農業、林業、漁業、食糧、環境といった関連分野における用語の多言語による概念体系をSKOS形式で表現されている。これらの概念は複数言語を横断して、研究結果を索引付けし、発見できるようにするために使用される。Linked Dataとして表現することにより、FAOはAGROVOCの語彙と他機関が維持管理する農業関係の語彙との間に明確な等価関係を作ることが可能になる。
図書館コミュニティには、図書館目録に索引付けするためのシソーラスが複数存在している。複数の図書館目録で、あらゆるシソーラスのキーワードを用いて、利用者が閲覧・検索できるようにすべきである。そのためには複数のシソーラスと分類システムの間にマッピングが存在することが重要である。このマッピングをLinked Open Dataとして提供することによって、さらに多くのシソーラスや分類システムをリンク付けしたシソーラスのネットワークの中に統合しやすくなり、それによって、複数の目録間での横断検索が容易になる。
Civil War Data 150 ("CWD150")は、地域・州・連邦の機関間で、アメリカ南北戦争に関するデータを共有し、関連付けるための協同プロジェクトである。南北戦争150周年を記念して、2011年4月から4年間にわたって実施されている。これらの多様な情報源を集約し、アメリカ南北戦争に特化しつつも、より広範な軍事用スキーマにも適合したオントロジーにマッピングすることによって、特定の場所、連隊、戦い、将校に関する情報を検索することが可能になる。CWD150は、南北戦争、とりわけ、連隊、戦い、戦場、将校、軍人、海兵について、強固な識別子とタクソノミーに基づく関連性を生み出すために、Linked Data技術を使用している。
メタデータの作成者は、著者名、タイトル、主題、地名など、記述対象リソースに関連する実体を符号化または参照するための方法を多く使用している。Linked Data技術は、各語彙にURIを付与することによって、これらの情報をアーカイブするのに使用することができる。統制語彙集の各語彙にURIを付与することで、外部システムのメタデータ記述はこれらの語彙を参照するためにURIを使用することが可能になる。
言語技術は、機械翻訳、自動要約、ウェブ検索やスペルチェックといった分野に適用される。言語技術に対して図書館Linked Dataがどれほど有用か調べるためには、まず一つ特定のユースケースに焦点を絞ることが肝要である。このようなユースケースとしては、単一言語または潜在的には複数言語間における名称実体の認識(Named Entity Recognition:NER)が挙げられる。NERに対する伝統的なアプローチは、場所、人物、機関についての情報を収録した辞典を適用することである。このアプローチは、辞典を最新のものに保たなければならないという短所がある。その他の問題としては、多言語間での辞典の作成を持続しなければならないことである。Linked Dataは、最新情報への対応、多言語間の関連付けという、NERの二つの問題点の解決策となり得る。
件名標目システムは、伝統的に事物、とりわけ概念の名称を標準化する方法を提供してきた。図書館の慣例では、件名標目を書誌レコード中に文字列として集積し、サーチエンジンによって索引付けされるようにHTML形式でウェブ上にレコードを表示している。Linked Dataの原則は、図書館が件目標目システムをウェブ上での検索や再利用のためにより効率的に利用することを可能にする。Linked Dataの原則では、人間・機械・セマンティックエージェントが総合的に利用できるように、より精緻にモデル化されたリソースを識別し、提供するために、ハイパーテキスト転送プロトコル(HTTP)によるURIとOWLを使用している。
図書館利用者は、多数の機関が関与し、大規模なメタデータの集約を行うリソースの統合検索サービスを一つの検索窓から利用できることを期待している。また、利用者は曖昧さがなく、文脈化された方法で、各々の言語と語彙を用いて主題検索を行うことを期待している。Linked Data技術は、意味上のマッピングや複数言語間で概念の結合を行うことで、基礎となるインフラを提供することができる。このユースケースでは、複数のLinked Data語彙を連携するためのいくつかの方法について議論している。
Linked Dataの原則の一番目は、「事物に対する名前としてURIを使用すること」を挙げている。しかし、非一貫性や過結合を防ぐためには、適用可能な概念モデルによってシステム的に管理され、合理化される必要がある。この概念モデルは、ユースケースに基づき、表現力のあるメタモデル言語で記述される。ウェブオントロジー言語(OWL)と統一モデル言語(UML)は、共通のドメインモデルを管理し表現するという方向性において内容折衝可能な2言語である。このユースケースでは、どのようにUMLのクラス図が、OWLベースのデータを検索、再利用、設計するために使用できるか示している。UMLのコミュニティは、両者のギャップを埋める一助となるOntology Definition Metamodel (ODM)を開発している。
Flemish Archipel Projectは、多様な記録機関から収集したデジタル資料へのアクセス提供と長期アーカイブに重点を置いている。このプロジェクトでは、図書館・文書館・博物館・放送局が、リポジトリのネットワークに各自のコンテンツを提供している。課題の一つとなっているのが、各部門において分野固有のメタデータモデルがそれぞれ使用されていることである。このような分野固有のメタデータ語彙・モデルがLinked Dataとして表現され、利用可能になることで、このプロジェクトは、各メタデータ語彙・モデル間で、より定型化され、検証されたマッピングを行うことができるようになっている。
デジタルオブジェクトの長期保存は、ストレージやバックアップに上限がない困難を伴う取組みである。この取組みには、技術やハードウェア・ソフトウェア環境の変化に合わせて、デジタルオブジェクトを変換することのできる信頼性の高い環境の提供を目標とする複雑な戦略が必要である。Linked Dataは、オブジェクトと重要なプロパティを記述するためのグローバルな環境を提供する。この環境では、リソースとその属性の記述にかかる労力を削減し、複雑な検索や操作を行うために必要とされるすべての情報を包括するグローバルな情報グラフを発展させることができる。
Europeanaは、ヨーロッパ中の図書館・文書館・博物館・視聴覚資料館と連携してサービスを提供している。Europeanaでは、様々な文化遺産機関から提供されたメタデータを集約しており、ウェブ上のポータルやAPIを通じて、単一の方法により、様々なオブジェクトのコレクションを検索することができる。記述対象となるデジタルオブジェクトの再利用、デジタルオブジェクトへの参照を増やすことも目的としている。Linked Dataは、Europeanaがメタデータモデル間の意味上の相互運用性を向上させ、既存メタデータを強化、データオブジェクトとリンクの収集を改善する一助となるとともに、検索プロセスの向上、第三者によるメタデータへの容易なアクセスを可能にしている。
Archives Hubは、イギリスに所在するアーカイブに関する多分野にまたがる多数の情報を提供する国によるサービスである。LOCAH Projectは、Hub上のデータと、DBPedia・BBC・LCSH等を含む他の情報源とのリンク生成について調査を行っている。利用者研究とログの分析から、Archives Hubの利用者は、内容記述から水平方向への検索を頻繁に行っていることが判明した。Linked Dataは、水平方向の検索による利点を拡張し、アーカイブコレクションと広く分散して存在するその他リソース間にリンクを作成することによって、利用者が文脈上関連する資料を発見する一助となっている。
写真コレクションは、インターネット上で人気のある資料である。写真コレクションの長期保存に取り組む機関は、画像を表示・提供するための新しいツールや手順が必要になっている。そうした機関は、資料と保存に関する物理的記述、内容、エージェント、契約、知的財産権等といった異なる観点からコレクションを記述する複数のリンク関係を持ったデータベースを持っている。Linked Dataの手法は、異種のデータおよび情報源によって引き起こされる技術的な問題に対して、優れた解決策を提供することができる。
多くのラジオ局は、過去数年にわたる音声番組のアーカイブを持っている。多くの場合、それらの音声番組はデジタル化されておらず、またメタデータがほとんどないか、あった場合でも一貫性を欠いている。メタデータの作成や転写の作業は、多くはその都度行われており、図書館の確立された手法に幾分準拠しているというのが現況である。Linked Dataを用いることによって、その他イベントへの相互参照が可能になる。これは対象となる音声番組が新規の放送である場合にとりわけ有益である。また、相互参照の関係を用いて統合検索を行うことで、デジタル化作業に付加価値を与えるとともに、その結果によってもたらされる潜在的効果を高めることも可能である。
米国議会図書館が主宰する全米デジタル情報基盤整備および保存プログラムの協力コミュニティは、急速に増加するデジタルコンテンツを現在と未来の世代に伝えるために、その収集組織化・保存に関する国レベルの戦略を策定することを目的としたイニシアティブである。これらの多様なコレクションは、180に及ぶ機関の各地に分散したリポジトリやアーカイブシステムに保存されている。そこでは、危険な状態にあるデジタルコンテンツが、その業界や分野に最適な方法で収集・管理・保存されている。Linked Data技術は、図書館員や学芸員がコレクションをウェブ上に公開するためのプラットフォームであり、コレクションを増強するための情報源ともなる「Recollection」で使用されている。結果として、この情報の潜在的な利用者が、様々な新しい方法で、データを発見し、分析できるようになっている。
カンタブリア文化遺産のオントロジーは、 カンタブリア(スペインの北部地方)の遺産に関するそれぞれの観点における知識を一つにまとめることを目的としている。この知識は、工業から考古学的遺跡、科学的・文化的遺産から 民俗学的情報にまで及び、これらの豊かな遺産の各体現形に対して、エージェント、著作、イベント、歴史区分の情報が与えられている。データは、政府刊行物、単行書、雑誌記事、目録、一覧表、百科事典、データベース、ウェブサイト、考古学サイト、デジタルオブジェクトといった多種多様な情報源から来ている。これらのデータをLinked Dataとして提供することによって、カンタブリアの文化遺産に関する相当量の情報がLinked Open Dataクラウドに投入され、その情報をより可視的で有用なものにしている。
科学分野では、研究論文の刊行とともに、関連するデータも利用可能にする動きが強まっている。これらのデータは、研究雑誌または分野特定のリポジトリによって収集・保存されている。現在、利用可能なデータの引用方法に関するデファクト標準は存在しない。Linked Dataは、識別子を付与する方法、語彙を用いてデータ、メタデータ記述、出版物、寄与者や著者をリンクする方法に関して指針を提供する。Linked Dataを用いることで、結果、自動化されたシステムが、信頼度を計算するためにデータを抽出したり、とりわけ同一人物に対する関連を作成したりすることが可能になる。加えて、人間の利用者が出版物からのナビゲートによってデータに関するメタデータ記述を見て、それからデータにアクセスすることができるようになる。
図書館とその他リポジトリは、雑誌、論文集、レポート、メモ、図書の各章といった形で科学研究論文を保存している。論文は主にテキストと図表から構成される。また各論文で利用可能な紙幅には限りがある。こうした制約のため、元データ、動画、容量の大きい大量の画像等を論文に含むことは難しくなっている。強化された出版物のユースケースは、論文に紙だけではなく、元データ、モデル、アルゴリズム、説明用画像、メタデータセット、またはコメントやランキングといった刊行後のデータを付加することを目的としている。このシナリオにLinked Dataを適用することで、同種の研究資料のコレクションを作成し、研究のプロセスに論理的一貫性を生み出せるようになり、研究をより比較可能でより透明性の高いものにすることができる。
Bibliographicaプロジェクトは、図書館データで通常利用できる以上に、著作と著者間の豊かな関係性を捉えていくことを目的としている。究極的には、著作やその他出版物、著者を参照することによって、思想や学術的な議論の発展を把握できるようにすることが目的である。このような発展と議論の情報は、直接グラフとして表現され、Linked Dataの原則のもとで提供されている。
現在、書籍・DVD・CD・テレビ番組・オープンな教育用リソース等、Open Universityのコースに関連するあらゆる資料を探し求める学生は、求めるリソースの種別ごとにそれぞれ別のシステムとインターフェースを持つ、様々な情報源にその都度当たらなければならない。また、そうした学生は、結果の分析と統合を手動で行う必要がある。また、似たようなシナリオとして、講師が新しいコースや授業を開設する際に同一のリソースが必要になる場合や、研究者が研究成果を既存のリソースに結び付ける場合も挙げられる。Open UniversityにおけるLUCERO(Linking University Content for Education and Research Online)プロジェクトは、学生と研究者向けにリンク付けしたデータを公開するためにLinked Data技術と手法の調査とプロトタイプ開発を行っている。
デジタルテキストリポジトリは、様々な量と範囲の適切なメタデータを含むデジタルリソースを生産・蓄積・提供している。基本的にこのようなリポジトリは、大部分の図書館とは違って、FRBRで言うところの新しい体現形、つまりは、彼らが用意するテキストのデジタル形式のバージョンを作成している。 理想的には、デジタルテキストリポジトリは、FRBRの著作や表現形の実体を定義する必要はない。というのも、他で定義されたこれらの実体を参照することができるからである。Linked Dataを用いることで、デジタルテキストリポジトリは、発見、選択、意味的なリンク付けの作業を促進することにより、多数のメタデータ、典拠データ、またはその他データの提供者に各所蔵情報を記述してもらうことができるようになる。
図書館とその他リポジトリは、雑誌、論文集、レポート、メモ、図書の各章といった形で科学研究論文を保存している。論文は主にテキストと図表から構成される。また各論文で利用可能な紙幅には限りがある。こうした制約のため、元データ、動画、容量の大きい大量の画像等を論文に含むことは難しくなっている。強化された出版物のユースケースは、論文に紙だけではなく、元データ、モデル、アルゴリズム、説明用画像、メタデータセット、またはコメントやランキングといった刊行後のデータを付加することを目的としている。このシナリオにLinked Dataを適用することで、同種の研究資料のコレクションを作成し、研究のプロセスに論理的一貫性を生み出せるようになり、研究をより比較可能でより透明性の高いものにすることができる。
Editing Reports on New Academic Documents (Ernad) は、Altai paperと呼ばれるプロトコルを実装したソフトウェアの一部である。Ernad設計の目的は、ある文書がその主題に当てはまるかどうか主題分類の編集者が判断する助けとなることである。Ernadプログラムは、RePEcデジタル図書館が提供するサービスであるNew Economics Papers(NEP)で使用されている。Linked Data技術により、動的に変化する学習に関する分類システムのプロセスを一般化したより汎用的な仕様を提供することが可能になる。また、Linked Dataは、当該サービスから出力されるデータ形式の標準となる基盤を提供しており、これにより、このサービスをその他の関連する情報サービスに容易に移植できるようになっている。
National Digital Newspaper Program (NDNP)は、全米人文科学基金(National Endowment for the Humanities:NEH)と米国議会図書館(LC)が共同で実施する、1836年から1922年に刊行されたアメリカ合衆国の新聞へのアクセス向上を目的としたプロジェクトである。Chronicling Americaは、利用者向けのウェブアプリケーションであり、利用者は250万ページ以上のデジタル化資料を検索・閲覧できるとともに、あらゆる形式の新聞のタイトルを特定するために、14万タイトルの新聞に関する書誌情報と所蔵情報を収録する全国新聞目録を調べることができる。Linked Dataの原則は、Chronicling Americaの識別空間を設計するための基盤を与えている。関心を持つ団体が、独自の環境で使用するために、ウェブアプリケーション上からデータを抽出できるようにすることを目標としている。ウェブアプリケーションは、各新聞のタイトル、号、ページごとにURIを付与するように設計されている。
ラトビア国立図書館(NLL)の地図資料コレクションのデジタル版には、16世紀から18世紀までの歴史的な地図資料の複製物が含まれている。現在、地図資料はHTMLでタグ付けされたページとして表示され、PDF形式のスキャン画像にリンクしている。タグ付けされたページには、これらの地図資料に関する半構造化されたテキスト情報が付加されている。地図資料やその他オブジェクトは、グローバルに参照可能となるよう、HTTP URIスキームによって与えられている。地図資料のメタデータは、RDFaを使用、またはリソースの他表現やメタデータにリダイレクトするHTTP303転送を使用しており、Linked Dataとして利用可能である。地図資料は、地名や個人名典拠等、Linked Dataとして表現された関連リソースにリンクをしている。
ドイツ経済学中央図書館(ZBW)の20th Century Press Archivesは、テーマ別にフォルダに整理された、1826年から2005年までの人物、会社、主題、商品に関する新聞切り抜きの大規模なコレクションである。コレクションの一部については、記事のソースや日付、会社の名前や所在地といったメタデータが、利用可能である(ドイツ語のみ)。OAI-OREは、大規模で深い階層を持ったデータ集合を組織化するための基盤となっている。各集合レベルに対して、集約されたリソースへのアクセスが提供される。検索結果はOREの集合レベルに基づき動的に表示される。集合レベルのデータは、RDFaでタグ付けされたリソースマップとして記述され、他のLinked Dataのデータセットとリンク付けされている。
AuthorClaimの登録サービスは、書誌データベースに記録された研究者が執筆した著作に関するレコードと研究者情報をリンクすることを目的としている。このアプリケーションは、著者の識別に貢献することができる。このアプリケーションのシナリオでは、文書に対するメタデータは、主題作業の専門家によって分類される。各専門家は、文書がその分類に属すかどうかという二者択一の判断を行う。その結果として、文書のコレクションは、ある一冊の主題に関するレポートになる。Linked Dataは、基本アプリケーションをさらに汎用化し、アプリケーション結果の再利用を促進するために使用されている。
コレクションレベルの記述は、コレクション全体に関するメタデータで構成されるものである。これは、コレクションの個々の構成要素となるアイテムレベルの記述(FRBRで言うところの体現形レベルの記述に相当)と対照的な記述である。多種多様な情報源に由来し、地理・大学・日用品といった他のデータセットにリンクするコレクション記述をLinked Dataとして定義し、提供することによって、機能豊富であるが、サービス提供者やエンドユーザーによるカスタマイズが可能な拡張性の高いサービスを提供することができるようになる。
研究グループ、大学の学部、学術団体、特別利益団体等のように様々な規模の学術組織が、それぞれの分野の情報に対する注目や品質を維持し、情報をより広範な学術コミュニティや世間一般に広く公開することに強い関心を持っている。Linked Dataの手法は、こうした目的のために、再利用可能なオープンライセンスのデータを提供する。また、情報の収集整理と共有への参画に対する障壁を下げるAPIやデータ標準規格、クライアントソフトウェアをサポートする。
デジタル資料の検索は一筋縄ではいかない。資料の利用可能性とそれへのアクセスは、図書館の購入状況、アクセス場所による利用制限、各国の著作権法によって異なる。個人は、時に個人の寄贈やメンバーシップによって増強される多様な図書館コレクションにアクセスするための権利を持っていると言えるかもしれない。Linked Data技術は、機関主体ではなく、利用者主体の電子情報リソースへのアクセスを可能にする。利用者個人の登録情報や図書館の権限に応じて、利用者が個別資料にアクセスできるかどうか決められるようになる。
図書館は、セマンティックウェブ的な言い方をすれば、それ自体リソースである。書籍や著者が識別されるのとちょうど同じように、図書館もURIによって識別される必要がある。HBZ (Hochschulbibliothekszentrum des Landes Nordrhein-Westfalen) は、図書館機関に対する識別子のLinked Dataセットを作成している。これは、所蔵データの書誌データへのリンク付けや、開館時間、建物や図書館員に関する情報を提供する位置情報にも対応したモバイルアプリケーションのような、様々なLinked Dataを利用したシナリオと連携することが可能である。
総合目録における書誌的リソースの検索は、特定の物理的形態をとる体現形を識別することができる。体現形は一つ以上のコレクションに所在する複数の個別資料に紐付く。利便性のため、つまりは個別資料の入手にかかる時間を短縮するために、所定の場所から最寄りのコレクションを特定することは有益である。図書館やその他情報サービス機関の場所を記録する方法は、統制されておらず、ばらつきがある。Linked Data技術は、特定の資料とその地理位置情報を調べるために、図書館目録を用いてナビゲートする標準的で系統だった方法を提供する。
研究グループ、大学の学部、学術団体、特別利益団体等のように様々な規模の学術組織が、それぞれの分野の情報に対する注目や品質を維持し、情報をより広範な学術コミュニティや世間一般に広く公開することに強い関心を持っている。Linked Dataの手法は、こうした目的のために、再利用可能なオープンライセンスのデータを提供する。また、情報の収集整理と共有への参画に対する障壁を下げるAPIやデータ標準規格、クライアントソフトウェアをサポートする。
Linked Data技術は、書誌データと他の関連するデータを相互リンクするための方法を提供する。ドイツ連邦環境庁(The Federal Environment Agency, Germany:UBA)は、知識組織化の長い伝統を持っており、観測データや分析結果を提供するウェブベースの情報システムと図書館リソースを組み合わせるといったことを行ってきた。現時点では、図書館リソースとこれらのデータ表現は分離されている状態である。Linked Dataを用いることによって、シソーラス・辞典・年代記から構成される参照語彙で増強した分類システムを図書館データとリンク付けすることができる。UBAは、書誌情報を関連する環境の観測データと相互リンクし、それぞれを参照語彙にリンク付けすることを計画している。
Linked Data技術は、レコードの改善や増強、さらには新規レコードの作成を目的として、ボランティアに書誌データを提供する一助となっている。このような取組みは、ローカルな目録に利益をもたらす。同時に、この結果として作成されたレコードはOpenDataとして設計され、より広く利用できるようになる。
科学関係の出版の過程において、冊子体の刊行は、研究者の情報環境にあるデータやリンクとは隔離された文脈に置かれている。Mendeleyは、文書間のリンク付けにアルゴリズムの手法を用いるほか、クラウドソーシングによりソーシャルな方法で作成された各視点に基づくメタデータを用いて、刊行物に文脈による意味づけを付加することを提唱している。こうした機能は、Linked Dataやグラフによる関係性や相互引用等のリンク分析を利用することができる。
Open Libraryは、およそ2,500万件のメタデータを収録する大規模な書誌データベースである。図書や100万件を超えるデジタル化した図書にリンク付けされた全文テキストのメタデータも含まれる。このシステムは、同一著作の異なる版を集約し、複数の版が存在する場合に著作のデジタル版を発見しやすくしている。データベース内の各プロパティと実体にはURIが付与されており、APIは各実体(著作・版・著者)の情報をRDF/XML形式で出力している。
図書館目録は、検索結果のランキングにおいては限られた成功しか収めていない。どの資料が最も人気があるのかを調べるために多くの図書館から収集した貸出データを図書館が使用できるのであれば、検索結果のランキングをより効果的なものにすることができる。図書館が貸出データをLinked Dataとして提供し、それらを書誌データとリンク付けすれば、データをトリプルストアに搭載し、SPARQLで検索することができるようになる。
図書館における関心の一つは、ウェブのサーチエンジンを通じて、自身のデータを検索可能にすることである。しかし、図書館目録はデータのサイロとして認知されている。図書館は、ボットによるウェブクローリングに対応したアーキテクチャを採用すること、サーチエンジンがコンテンツを効率的に処理できるように提供するコンテンツを最適化することの双方を行うことによって、自身のデータをよりアクセスしやすいものにする必要があることを自覚している。ウェブにおける主要なプレイヤーは、結果ページまたはソーシャルネットワーク用ページ等のツールにおけるデータの表現方法を改善するために、RDFaやその他のメタデータ構造化フォーマットを使用することに関心を示している。このような構造化データを図書館のオンライン目録に付加することで、図書館データの可視性とアクセス性を向上させることができるようになる。
Facebookの「いいね!」ボタンと同様の仕組みを持つ、「この書籍を支援する」のボタンを図書館のオンライン目録や関連ウェブサイトに設置し、Gluejarの目録に接続することで、ボタンを押すと、この書籍をCCライセンスの電子書籍として出版することを支持することが表明される。利用者が「支援する」のボタンをクリックすると、システムは対象となるウェブページからメタデータを収集する。RDFa/BO+DC は、この用途のメタデータにとって適したフォーマットである。システムはメタデータを受け取ると、Gluejar の目録で支持された著作または支持された著作のリストにリンクするために使用される。Linked Data技術は、このようなシステムの実装と適用を加速することができる。
書籍や研究論文等を読む際、人はしばしばリソースに注釈を付ける。かつては、これらの注釈は紙の上に記録されたが、現在は電子的に作成され、オンライン上で公開されることが急速に増えている。Linked Dataを用いることで、利用者は他の人によって注釈が再利用できるように、注釈のメタデータを記述し提供することが可能になる。
現在、書籍は、知っている人同士で共有するのが普通である。しかし、図書館以外の個々人が、組織立った方法で書籍の共有と交換を行うための仕組みが用意されている。CCやGNUのライセンス下で提供される、またはパブリックドメインとして提供される電子書籍のように利用制限のないものは、URIを共有するだけで共有可能である。利用に制約のある電子書籍については、合法的に共有する機会や選択肢はより限られてくる。既存の電子書籍の貸出条件の制約を調査することは、ビジネスモデルの改善にもつながる。これは結果として、共有の文化を強化する。Linked Data技術は、CCのような機械可読のライセンス表示を用いることで、ソーシャルネットワークや個々のウェブページといった様々な情報源からデータを集約することを可能にする。
現在、データリソースやAPIが図書館サービスから提供されることは稀であり、それを行うために特別な許可が必要とされることもある。Linked Dataの技術と原則は、図書館データをサードパーティのアプリケーションで使用できるように公開する一助となる。利用者は、データの消失や権利問題を恐れることなく共有・頒布することのできるデータを用いて、独自のアプリケーションを提供することが可能になる。
図書館目録では、通常、利用者との関連性に応じて検索結果のランキングを提供することを行わない。図書館オンライン目録は、資料の人気や利用者の活動について利用可能な情報に基づいてレコメンデーションや検索ランキングを利用者に提供することができる。このシナリオで、Linked Dataは、ランキングやレコメンデーションを表現するソーシャルデータを検索用アプリケーションに接続するために使用することができる。
ユースケースの調査を企画し、収集したユースケースを類型化し、その結果としての類型を記述する作業に従事した以下の図書館Linked Dataインキュベーターグループのメンバーに感謝の意を表する。Mark van Assem, Asaf Bartov, Emmanuelle Berme`s, Uldis Boja-rs, Karen Coyle, Ray Denenberg, Monica Duke, Gordon Dunsire, Kai Eckert, Alexander Haffner, Antoine Isaac, Martin Malmsten, Andra's Micsik, Tod Matola, Peter Murray, Joachim Neubert, Michael Panzer, Felix Sasaki, Jodi Schneider, Anette Seiler, Ed Summers, Bernard Vatant, William Waites, Stu Weibel, Jeff Young, and Marcia Zeng
また、コミュニティから個別事例の提供について多大な貢献があったことについても記しておく。Xavier Agenjo, Tomas Baiget, Thomas Bandholtz, Sam Coppens, Klaas Dellschaft, William Gunn, Jan Hannemann, Eric Hellman, Francisca Herna'ndez, Patrick Hochstenbach, Anne Isomursu, Phil John, Leslie Johnston, Johannes Keizer, Thomas Krichel, Kathy MacDougall, Steven Morris, Guenter Muehlberger, Jim Pitman, David Smith, Owen Stephens, Adrian Stevenson, Jane Stevenson, Maurice Vanderfeesten, Jon Voss, Romain Wenz, and Anne-Lena Westrum
当文書の策定にあたっては、JISC Open Bibliographic Data Guide自体とともに、これに対してOwen Stephensが提供する情報も参考にした。このガイドは、いくつかの事例の基礎となっている。