TOPシステムトレンド> なぜデータベースのスケールアウトは難しいのか
近未来データベース
近未来データベース

第1回:データベースを取り巻く状況
著者:NTTデータ先端技術  鈴木 幸市   2005/8/8
前のページ  1  2   3  4  次のページ
なぜデータベースのスケールアウトは難しいのか

   Webサーバやアプリケーションサーバとデータベースサーバの違いは、共有データを処理するかどうかにあります。

   Webサーバの場合は、それぞれのWebサーバが別々のブラウザを相手にしており、ブラウザ同士の動きには関連はありません。ですからWebサーバは、別のブラウザを相手にしている限りは別のサーバを気にする必要はなく、それぞれ勝手に動くことが可能です。アプリケーションサーバも同じで、基本的にはWebアプリケーションは1つのブラウザだけを相手にしていて、他のブラウザには関係がありません。

   一方データベースは、基本的には共通データを管理します。共通データとは、複数のブラウザから同時に読み書きされる可能性があるデータのことです。

   例えば、Webページでの投票でYes/Noを集計する場合を考えます(図2)。

Yesを数える
図2:Yesを数える

   あるブラウザからYesが入力されると、現在のYesの数を読んでこれに1を加え、これをYesの数に書き戻します(面倒なようですが、コンピュータの中ではこのように演算するしかないのです)。

   この間に別のブラウザが同じようにYesの数を読み、これに1を加えてしまうと、全体としての結果は誤ったものになってしまいます。この場合最初のブラウザがYesの数を増やし終わるまで、次のブラウザは待っていなければならないのです(図3)。

共有データの処理では交通整理が必要
図3:共有データの処理では交通整理が必要

   データベースはこのようなデータの読み書きが正しくできるように、多くの機能を提供しているのです。この場合注意してほしいのは、この「Yes」の数を記録する場所(メモリでもディスクでも)は、何個のブラウザがこのサービスにアクセスしていたとしてもただ1つであるということです。ですからいくらデータベースの性能が悪いからといって、単純にデータベースサーバを増やしても、Yesの格納場所が2つになってしまうだけで、このままでは正しく処理はできません(図4)。

共有データを増やしてもあまり意味がない例
図4:共有データを増やしてもあまり意味がない例

   非常に単純な例でしたが、アプリケーションの「共有データ」を扱うデータベースにとってシステムの中に複製があっては困るので、単純にスケールアウトすることが大変難しいことはおわかりいただけると思います。

   アプリケーションサーバはスケールアウトできると書きましたが、ここでも複数のブラウザを相手にする際に共有データが必要になることがあります。この場合にも、データベースの場合と同様に共有データに矛盾なく複数のアプリケーションが読み書きできるようにしなければならなくなり、単純にはスケールアウトできなくなります。

前のページ  1  2   3  4  次のページ


NTTデータ先端技術株式会社 鈴木 幸市
著者プロフィール
NTTデータ先端技術株式会社  鈴木 幸市
Unixにおける日本語ハンドリング、Oracleの移植、オブジェクトリレーショナルデータベースのエンジンの開発などに携わる。現在、NTTデータ先端技術にてLinux、PostgreSQLなどのオープンソースソフトウェアに関する技術を統括している。著書に「RDBMS解剖学」(翔泳社)、訳書に「オブジェクト指向データベース入門」(共立出版)など。


INDEX
第1回:データベースを取り巻く状況
  はじめに
なぜデータベースのスケールアウトは難しいのか
  データベースとはどんなソフトウェアか
  信頼性