TOP業務システム> はじめに
セマンティックWebによる情報統合 〜Web 2.0と情報活用を支えるメタデータ
セマンティックWebによる情報統合 〜Web 2.0と情報活用を支えるメタデータ

第1回:セマンティックWebとは
著者:野村総合研究所   田中 達雄   2006/7/26
1   2  3  次のページ
はじめに

   近頃、インターネットの世界(Web 2.0の世界)では、マイクロフォーマット/タギング/フォークソノミーといったメタデータやセマンティックWebに関係する技術が盛んに使われるようになってきた。また、エンタープライズの世界でも先進企業によるセマンティックWebを応用した情報インテグレーション事例が紹介されはじめている。

   企業だけではなく個人においても、肥大化と多様化する情報を有効に扱うことが目下の課題であり、そのための有効手段としてメタデータやセマンティックWebがあらためて注目されはじめている。そこで、本連載では「セマンティックWebによる情報統合」をメインテーマにおき、Web 2.0とエンタープライズの情報活用を支えるメタデータ技術の将来像ついて解説していく。

   第1回の今回は、そもそも「セマンティックWeb」とは何かを解説する。

セマンティックWebとは

   セマンティックWebは、1998年にティム・バーナーズ・リー氏によって提唱された技術であり、「情報リソースに意味(セマンティック)を付与することで、人を介さずに、コンピュータが自律的に処理できるようにするための技術」と定義されている。

   コンピュータに「自律的な処理」の能力を与えるためには、情報リソースに意味を持たせる必要があり、少なくとも「メタデータ」と「オントロジー」が必要になる。自律的な処理のためには情報リソースにメタデータを付与し、かつオントロジーで意味の理解を補足してやる必要がある。

   まず、セマンティックWebとは何かを理解するためには、この「メタデータ」と「オントロジー」の理解が欠かせない。以降、それぞれの解説をする。


メタデータとは

   メタデータとは「情報に関する情報」であり、情報リソースに対する情報リソースの意味(セマンティック)を説明する別の情報のことである。簡単にいえば「データフォーマット」のことである。メタデータを使えばその情報リソースの意味を人のみならずコンピュータにも理解させることが可能となる。

   「田中、170、70、19660101、…」という情報リソースに対し、「名前、身長、体重、生年月日」といったメタデータを付与した例を図1に示す。

メタデータが付与された情報リソース
図1:メタデータが付与された情報リソース
出典:野村総合研究所

   メタデータが付与されていない情報リソースを見た場合、人であればなんとなくその意味が理解できるが、コンピュータがそれを自律的に理解することはできない。しかしメタデータが付与された状態であればコンピュータに自律的に処理させることが可能になる(例えば、平均身長や平均体重を計算するなど)。

   これはWebページを情報リソースに見立てた場合も同じことがいえる。Webページは人が見て理解できるようにHTMLで書かれているが、そこに書かれている1つ1つのデータに対して意味は付与されていない。そのためコンピュータはキーワードによる文字列検索はできるが、情報リソースの意味を理解しながら検索することは困難である。

   図2では「東京丸の内近辺の歯医者を探したい」という利用者の要求に対して、文字は合っているが利用者が求める情報でない「沖縄県那覇市の丸の内歯科医院」が検索されてしまっている。後は人が目で見て判断していくしかない。

メタデータを使わないWebページ検索
図2:メタデータを使わないWebページ検索
出典:野村総合研究所

   次に図3を見てほしい。この例ではWebページにメタデータが付与され、そのメタデータに対して検索を行っているため、不要な「丸の内歯科医院」は検索されない。このように人を介さずコンピュータにある程度自律的に処理をさせるにはメタデータは有効である。Web 2.0の世界ではマイクロフォーマットのhCalenderやhCard、hReviewなどがその具体例としてあげられる(これらについては、第2回で解説する)。

メタデータを付与したWebページのメタデータ検索の例
図3:メタデータを付与したWebページのメタデータ検索の例

1   2  3  次のページ


野村総合研究所 田中 達雄
著者プロフィール
株式会社野村総合研究所  田中 達雄
1989年4月に富士通株式会社に入社。ソフトウェア工学を専門分野とし「UMLによるオブジェクト指向開発実践ガイド(技術評論社出版)」を共著。2001年2月に野村総合研究所に入社。現在、情報技術本部にてIT動向の調査と分析を行うITアナリスト集団に所属。Webサービス/BPMなどの統合技術、エンタープライズ・アーキテクチャなどが専門。


INDEX
第1回:セマンティックWebとは
はじめに
  メタデータの限界
  セマンティックWebの標準化動向