TOP設計・移行・活用> はじめに
Big Brother
Big Brotherによるネットワーク監視

第7回:機能拡張 - LARRD
著者:イー・モバイル  矢萩 茂樹   2006/4/11
1   2  3  4  次のページ
はじめに

   前回は警報通知やサーバメンテナンスなどの保守ツールを紹介しましたが、今回はいよいよBig Brother(以下、BB)システムに機能拡張をプラグインします。
障害予測を可能とする経過監視

   BBはネットワーク監視を行うツールであり、これを使うことによってネットワークの稼働状況を簡単に把握することができます。

   安定稼働のためにはリソースの使用状況管理が必須となります。BBでは、プローブクライアントによるリソース監視機能を備えていますが、BBで検知できる障害はあくまでも現在の状況に限られます。

   稼働データの使用経過を時系列に整理・グラフ化すると将来のリソース不足などの予測も可能となります。

   図1と図2はWebサーバのディスク使用率の経過をグラフ化したものです。図1は48時間周期の短期レンジ、図2は576日周期の長期レンジで集計しています。

Webサーバのディスク使用状況経過(短期レンジ:48時間周期)
図1:Webサーバのディスク使用状況経過(短期レンジ:48時間周期)
(画像をクリックすると別ウィンドウに拡大図を表示します)

Webサーバのディスク使用状況経過(長期レンジ:576日周期)
図2:Webサーバのディスク使用状況経過(長期レンジ:576日周期)
(画像をクリックすると別ウィンドウに拡大図を表示します)

   短期レンジ(図1)ではほぼデイリーバッチによる変化で大きな変化はみえませんが、長期レンジ(図2)での経過をみてみると/exportパーティションが緩やかな上昇傾向をたどっていることがわかります。グラフの傾きからおおよそのディスク増設の時期を予測することで、事前に障害を防ぐことが可能となります。

   この手法は経過監視と呼ばれ、主にネットワークのインターフェースのトラフィック監視やサーバの内部リソース監視に用いられます。増加傾向・減少傾向などのトレンドだけでなく、周期的な状況変化の把握にも用いられます。

   経過監視のためのツールとしてはMRTG(Multi Router Traffic Grapher)が有名であり、MRTGを使ったトラフィック監視システムを別に立ち上げられている方もいるのではないかと思います。


グラフ化ツールLARRD

   ネットワーク監視ツールによる稼動状況確認は、定期的な稼働情報収集という見方もできます。これは経過監視のための定期的な情報収集とまったく同じ作業です。BBの監視によって収集した情報のグラフ化ができれば、BBで経過監視も同時にできます。これを実現したのが今回紹介する機能拡張ツールLARRD(Load Average RRDtool)です。

   LARRDはBBの監視情報から経過監視グラフを作成します。LARRDをBBに追加すると、監視TOP画面にて各監視対象の監視項目アイコンに"trends"という項目が追加されます(図3)。

LARRDトップ画面
図3:LARRDトップ画面
(画像をクリックすると別ウィンドウに拡大図を表示します)

   このアイコンが経過監視グラフへのリンクになっており、これをクリックすると図4のような監視対象の監視リソースをグラフ化した情報画面が表示されます。

LARRD画面
図4:LARRD画面
(画像をクリックすると別ウィンドウに拡大図を表示します)

   グラフ化される項目は各監視対象で監視している項目によって変わります。ルータやスイッチなど単純にIP死活監視やサービス稼働監視のみをしているノードの場合、監視サービスの応答時間のみがグラフ化されます(図5)。

ネットワークサービスの応答グラフ
図5:ネットワークサービスの応答グラフ
(画像をクリックすると別ウィンドウに拡大図を表示します)

   サーバなどのプローブクライアントBBCLIENTをインストールしている監視ノードにおいては、プローブからの情報を用いてCPU/ディスク使用率/プロセス数/ログインユーザ数などの情報をIP/TCPサービス応答時間とあわせてグラフ化されます(図6)。

DISK使用率経過グラフ
図6:DISK使用率経過グラフ
(画像をクリックすると別ウィンドウに拡大図を表示します)

   作成されるグラフはRRDtoolの機能により時間別/日別/週別/月別の4つのレンジのものが作成され、48時間周期の短期トレンドから、578日周期の長期トレンドまでをひと目で把握できるようになります。

   LARRDはあくまでもグラフ化に特化した拡張スクリプトであり、記録した値が正常値なのか、異常値なのかという判断はしません。こちらはDISK使用率監視やCPU使用率監視、サービス正常性確認などの各監視機能に任せることになっています。この点は注意しましょう。

1   2  3  4  次のページ


イー・モバイル株式会社 矢萩 茂樹
著者プロフィール
イー・モバイル株式会社  矢萩 茂樹
2000年、個人で使えるメガレベルのサービスの可能性を目のあたりにしてADSL事業の立ち上げに参加。ADSLによるブロードバンドIPネットワークの設計・企画に従事。その関連業務で気軽に使えるネットワーク監視手法が必要となり、派生的結果としてオープンソースベースのツールをInternetWeekなどで紹介するに至る。現在、空気媒体のブロードバンド実現に向けて奮闘中。


INDEX
第7回:機能拡張 - LARRD
はじめに
  LARRDのインストール手順概要:BBサーバへのインストール
  6. LARRDサイト情報の設定
  BBCLIENT用LARRDのインストール手順概要