第8回：GROUP BYを使用したチューニング (1/2)

TOP＞書籍連動＞ GROUP BYによるチューニング

PostgreSQLチューニング実践テクニック

第８回：GROUP BYを使用したチューニング
著者：石井達夫（ISHII, Tatsuo） 2005/6/22

1 2 次のページ

GROUP BYによるチューニング

前回から引き続き、オプティマイザに関する注意点を解説します。ここではDISTINCTをGROUP BYに置き換えることによって処理を効率化できる例を紹介しましょう。

SELECT DISTINCTをSELECT…GROUP BYに置き換える

DISTINCTは一般にソートが発生する負荷の高い処理です。しかも、重複が多ければ多いほどPostgreSQLでは極端に効率が落ちてしまいます。

図17を見てください。bid列に対してインデックスを作成すればソートが発生しないので高速化できるはずですが、この例のように極端に重複が多いケースではあまり効果がありません。

test=# EXPLAIN ANALYZE SELECT DISTINCT ON (bid) bid, aid FROM accounts;
QUERY PLAN
-------------------------------------------------------------------------
Unique (cost=11786.60..12286.60 rows=1 width=8) (actual time=355.145..533.460 rows=1 loops=1)
->Sort (cost=11786.60..12036.60 rows=100000 width=8) (actualstime=355.141..461.437 rows=100000 loops=1)
->Sort (cost=11786.60..12036.60 rows=100000 width=8) (actual time=794.275..900.418 rows=100000 loops=1)
Sort Key:bid
->Seq Scan on accounts (cost=0.00..2640.00 rows=100000 width=8) (actual time=0.049..182.493 rows=100000 loops=1)
Total runtime: 535.437 ms
(5 rows)

図17：SELECT DISTINCTを使った場合

PostgreSQLは非常に効率の良いGROUP BYの処理ルーチンを備えているので、DISTINCTをGROUP BYで書き換えればかなり速度が向上します。

この例では、図18のように2倍以上高速になりました。しかもインデックスは不要です。

test=# EXPLAIN ANALYZE SELECT bid, min(aid) FROM accounts GROUP BY bid;
QUERY PLAN
-------------------------------------------------------------------------
HashAggregate (cost=3140.00..3140.00 rows=1 width=8) (actualtime=244.240..244.241 rows=1 loops=1)
->Seq Scan on accounts (cost=0.00..2640.00 rows=100000 width=8) (actual time=0.025..129.517 rows=100000 loops=1)
Total runtime: 244.726 ms
(3 rows)

図18：SELECT… GROUP BYを使った場合

図18に登場するHashAggregateはGROUP BYの高速処理ルーチンです。ただし、HashAggregateは比較的多くのメモリを必要とします。もし問い合わせプランがHashAggregateではなくてSortになってしまう場合は、postgresql.confのsort_memを増やしてください

1 2 次のページ

書籍紹介
まるごと PostgreSQL! Vol.1

日本での市場シェアNo.1（オープンソースRDBMS部門）データベースソフトPostgreSQLの最新情報を、開発メンバーを含む豪華執筆陣が多面的かつ詳細に解説します。PostgreSQL用クラスタリング／レプリケーションソフト、PostgreSQL⇔Oracle移行、PostgreSQLによる大規模サイト構築法、新バージョンPostgreSQL 8.0先行レビュー、PostgreSQL用.NETデータプロバイダ等々、他では読めない貴重な記事が満載です。

発売日：2004/12/08発売
定価：\1,890（本体 \1,800＋税）

著者プロフィール
石井達夫（ISHII, Tatsuo）
PostgreSQLの開発者、エバンジェリスト。本業でもPostgreSQLによるビジネスに関わっている。著書に「PostgreSQL完全攻略ガイド」「PHPxPostgreSQLで作る最強Webシステム」(技術評論社)などがある。

INDEX
第8回：GROUP BYを使用したチューニング
	GROUP BYによるチューニング
	システムを変えるチューニング

PostgreSQLチューニング実践テクニック
第1回	postgresql.confによるチューニング（1）
第2回	postgresql.confによるチューニング（2）
第3回	VACUUMの活用によるチューニング
第4回	インデックスの活用によるチューニング
第5回	高度なインデックスの活用
第6回	統計情報の最適化
第7回	オプティマイザに関するチューニング
第8回	GROUP BYを使用したチューニング