考え方をひっくり返してみよう

2008年5月23日(金)
須藤 克彦

insert_card()を作ろう

 さて、先送りしていたinsert_card()を作りましょう(図3)。

 今、要素$eを配列$arrの「適切」な場所に「挿入」したいという状況です(図3の1)。

 適切な場所を決めるためには次のようにします。

 まず並びを順に見ていって、要素$eよりも小さいものがあるうちはさらに次を見ていき、それよりも大きなものが現れれば、その直前が目的の場所です。

 ですから、今入れたい要素よりも大きなものが現れれば(図3の2)ループを抜けます(図3の3)。その時の配列の位置($i)が、目的の場所ということになります(図3の4)。

 なお、入れ先の配列が空の場合は、$iが0の状態で(つまりforループを一度も回らずに)ループを抜けますから、配列の先頭に要素を追加することになります。

比較作業を何回行っているか?

 さて、シンプルな(?)バブルソートからはじめて2つのバリエーションを示しました。いかがでしょうか?直感的には、はじめのものよりは、あとの2つの方がわかりやすかったのではないでしょうか。

 先のpickup_small()版も本質的にはバブルソートと同じことをしていましたが、今回の insert_card()版も実は同じことをしています(このあたりの分析は次回に説明します)。

 直感的なわかりやすさはともかく、それらの計算量(計算時間)について少しだけ考えてみます。どの方法でも、2つのモノの大きさを比較するわけですが、いずれも「総当たり」をしています(厳密には、純粋なバブルソートと今回の方法とでは若干違います)。
 何回の比較作業をしなければならないでしょう?

 n枚のカードがあったとして、1枚についてほかの(n-1)枚と比較するわけですから、全体ではn*(n-1)/2回の比較をすることになります(2枚の比較について、双方からの回数をカウントしているので2で割っています)。

 これを近似的にいえばn^2(nの2乗)の計算量です。ですから枚数が倍になると計算量は4倍になります。計算時間(処理時間)はほぼ計算量に比例しますから、枚数が10倍になると計算時間は100倍かかることになります!

 ものを並べ替えるという作業はコンピュータシステムの中では頻繁に発生します。それが、データ量の2乗に比例するというのは、遅すぎますね。

 そこで、次回(最終回)は、もっと性能のよいソートアルゴリズムを紹介するとともに、ソート以外の重要なアルゴリズムも紹介しましょう。

神戸情報大学院大学
1980年立命館大学理工学部卒、独立系ソフトハウスに入社。CやFORTRANコンパイラなどの言語処理系の設計・開発に約10年間従事。その後ユーザ系企業でUNIXによるクライアントサーバシステムの設計・開発を主導。同時に企業の内外で人材育成に注力する。現在は神戸情報大学院大学で講師として教鞭(きょうべん)をとる。「ソフトウエア工学の基礎を勉強してオールラウンドプレーヤーを目指せ」が技術者育成についての口癖。http://www.kic.ac.jp/professors/sudo/index.html

Think ITメルマガ会員登録受付中

Think ITでは、技術情報が詰まったメールマガジン「Think IT Weekly」の配信サービスを提供しています。メルマガ会員登録を済ませれば、メルマガだけでなく、さまざまな限定特典を入手できるようになります。

Think ITメルマガ会員のサービス内容を見る

他にもこの記事が読まれています