TOP書籍連動> 統計情報を確認する
まるごと PostgreSQL!
PostgreSQLチューニング実践テクニック

第6回:統計情報の最適化

著者:石井達夫(ISHII, Tatsuo)   2005/6/15
1   2  次のページ
統計情報を確認する

   PostgreSQLの問い合わせオプティマイザは、統計情報をもとにインデックスを使うかどうかなどの判断をしています。たとえば、図9の場合はインデックスが使われるのに、図10の場合はインデックスが使われないのは、オプティマイザが結果件数が多い場合は順スキャンの方が速いと判断するからです。
test=# EXPLAIN SELECT * FROM accounts WHERE aid < 100;
QUERY PLAN
---------------------------------------------------------------------
  Index Scan using accounts_pkey on accounts (cost=0.00..4.90 rows=67 width=100)
    Index Cond: (aid < 100)
(2 rows)

図9:EXPLAINの使用例3


test=# EXPLAIN SELECT * FROM accounts WHERE aid < 900000;
QUERY PLAN
---------------------------------------------------------------------
  Seq Scan on accounts (cost=0.00..2890.00 rows=99991 width=100)
Filter: (aid < 900000)
(2 rows)

図10:EXPLAINの使用例4


   こうした判断の材料となるのがシステムカタログのpg_statsにある統計情報です(注3)。統計情報は列ごとに管理されており、先ほどの例では、図11のようにすればaid列に関する統計情報を参照できます。

※注3: pg_statsはビューなので実際の統計情報は別の場所に格納されていますが、とりあえずはここを見れば統計情報がわかると考えてかまいません。
test=# SELECT * FROM pg_stats WHERE tablename = 'accounts' AND attname = 'aid';
-[ RECORD 1 ]-----+------------------------------------------------------
schemaname   | public
tablename    | accounts
attname      | aid
null_frac    | 0
avg_width    | 4
n_distinct   | -1
most_common_vals  |
most_common_freqs |
histogram_bounds  |
{33,10058,19754,30338,40134,49894,59318,68553,79195,89820,99970}
correlation  | 1

図11:統計情報の参照


   統計情報についてそれほど詳細に立ち入る必要はありませんが、histogram_boundsとmost_common_valsには注意を払う必要があるかもしれません。これらは検索の結果抽出される行数を計算するために使われる値で、インデックスを使用するかどうかに大きな影響を与えます(注4)。

※注4: テーブルの行数に関する統計情報はpg_classに格納されています。

   異なる値が多い場合は、histogram_boundsがNULL以外の値になり、テーブル行数を10等分したときに、境界となる列の値が配列として記録されます。これをグラフで表すと図12のようになります。

aidと行数の関
図12:aidと行数の関係


1   2  次のページ

書籍紹介
まるごと PostgreSQL! Vol.1
まるごと PostgreSQL! Vol.1 日本での市場シェアNo.1(オープンソースRDBMS部門)データベースソフトPostgreSQLの最新情報を、開発メンバーを含む豪華執筆陣が多面的かつ詳細に解説します。PostgreSQL用クラスタリング/レプリケーションソフト、PostgreSQL⇔Oracle移行、PostgreSQLによる大規模サイト構築法、新バージョンPostgreSQL 8.0先行レビュー、PostgreSQL用.NETデータプロバイダ等々、他では読めない貴重な記事が満載です。

発売日:2004/12/08発売
定価:\1,890(本体 \1,800+税)
石井達夫
著者プロフィール
石井達夫(ISHII, Tatsuo)
PostgreSQLの開発者、エバンジェリスト。本業でもPostgreSQLによるビジネスに関わっている。著書に「PostgreSQL完全攻略ガイド」「PHPxPostgreSQLで作る最強Webシステム」(技術評論社)などがある。


INDEX
第6回:統計情報の最適化
統計情報を確認する
  統計情報の最適化