TOP設計・移行・活用> 障害項目の詳細把握
Big Brother
Big Brotherによるネットワーク監視

第1回:ネットワーク監視とは何をするのか
著者:イー・アクセス  矢萩 茂樹   2005/9/14
前のページ  1  2  3  4
障害項目の詳細把握

   現在不具合が発生している項目だけをまとめた画面も準備されています(図8)。
障害サマリー画面
図8:障害サマリー画面
(画像をクリックすると別ウィンドウに拡大図を表示します)

   この画面ではdns.xy.jpのdns項目と稼働プロセス監視項目(procs)が「赤」になっており、他のホストの警告の「黄」がでていますが、それ以外にアラームが出ていないことがわかります。これで単体ホストの障害だと明瞭にわかります。

   各アイコンはそのまま詳細情報へのリンクとなっています。このアイコンをクリックすると障害詳細画面に移動し、検知した障害の詳細情報が確認できます。

障害詳細情報画面
図9:障害詳細情報画面
(画像をクリックすると別ウィンドウに拡大図を表示します)

   図9はdns.xy.jpのプロセス異常の詳細ですが、"sendmail"が1つも起動されておらず、ほかののプロセスはすべて"緑"で問題なしということがわかります。これでこの障害の原因はsendmailのプロセス異常だと判明します。

   この障害詳細情報画面には「HISTORY」というボタンがあり、このボタンをクリックすることで、図10の障害履歴画面に移ります。

障害履歴画面
図10:障害履歴画面
(画像をクリックすると別ウィンドウに拡大図を表示します)

   この画面ではいつから障害が発生し、どのぐらいの頻度で発生しているのかがグラフィカルに把握できるようにグラフ表示されます。


BBからの障害通知

   BBはネットワーク機器の監視を行い、障害を検知した場合には適切な管理者に通知を行います。このとき、管理者が障害原因の特定を迅速に行えるように障害詳細情報へのリンクを添付した形で通知をしてくれます。例えば以下のようなイメージです。

From bb@bb0.xy.jp Sun Sep 11 20:46:52 2005
Date: Sun, 11 Sep 2005 20:46:51 +0900 (JST)
From: bb supervisor <bb@bb0.xy.jp>
To: bb@bb0.xy.jp
Subject: !BB - 6004410! dns.xy.jp.procs - 300192168010001

[6004410] dns.xy.jp.procs red Sun Sep 11 13:46:35 JST 2005 Some processes are in error

&red sendmail >=1 - not running, requires at least 1
&green sshd >=1 - 1 instance running
&green cron >=1 - 1 instance running
&green named >=1 - 1 instance running
&green xinetd =0 - not running
&green inetd =0 - not running
&green syslogd >=1 - 1 instance running
&green bbrun >=1 - 2 instances running
&green httpd =0 - not running

Please see: http://bb0.aa.jp/bb/
html/dns.xy.jp.procs.html

   このメールからはdns.xy.jpのsmtpプロセスサービスが障害らしいとわかります。ここでミソはメール最後の"See http〜"の障害詳細情報のURLです。受け取った管理者はこのメールのこのリンクをクリックするだけで、先ほどの障害詳細画面に到達できます。

   またBBの便利さはメールに付属している障害詳細画面へのURLを基点として、すべての監視情報をマウスのクリックだけで把握可能なようになっていることです。監視情報に関連するすべてのBB画面左上にはナビゲーションパネルというアイコンが表示されており、この中の矢印アイコンをクリックするだけで障害サマリー画面と全体が表示されているトップ画面に移ることができます。

   障害箇所の特定はネットワークのノードをすべてに対してIP死活確認とサービス稼働確認を行い、共通の障害ポイントの絞込みから被疑装置を特定していく手順になります。これをBBの操作に当てはめてみると、以下のような手順になります。

  1. メールによる障害通知
  2. 障害詳細画面での発生障害の把握
  3. 障害点だけを抜き出した障害サマリー画面での障害概要把握
  4. トップ画面での全体から見た障害点の共通ポイントの絞込み

   以上の操作がすべてマウスのクリックだけで実現されています。BBにはネットワーク監視における障害ポイントの特定のためのフローがURLリンクによって盛り込まれており、導入することで品質向上につながるツールだと思います。

名前の由来

   「Big Brother」という名前ですが、小説家ジョージ・オーウェルが書いた小説「1984年」の中に出てくる、「The Big Brother Is Watching You.(あなたは監視されている)」に由来しているようです。このためかBBサーバとBBクライアント間で使うsocketはデフォルトで1984番となっています。

BBのライセンス

   BBは、オープンソースのBTF(Better Than Free)版と商用サポートがついたPE(Professional Edition)版の2つの製品があります。

   PE版はSolaris/Linuxにプラットフォームが限定されますがインストールが簡単になっており、BTFにはないテクニカルサポートや同社の製品であるSpotlight/Foglightというサーバのパフォーマンス監視ツールとの連携強化などがされています。

   BTF版は、非商用の用途においては無償で使用できます。ソースごとの形で配布されており、Linux/Solaris/BSD系OSなど多くのプラットフォームで稼働します。また、Windows版のサーバもありますが、こちらは商品になっています。
前のページ  1  2  3  4


イー・アクセス株式会社 矢萩 茂樹
著者プロフィール
イー・アクセス株式会社  矢萩 茂樹
2000年、個人で使えるメガレベルのサービスを目のあたりにして同社立ち上げに参加。ADSLによるブロードバンドIPネットワークの設計・企画に従事。その関連で気軽に使えるネットワーク監視手法についての検討からオープンソースベースのツールをInternetWeekなどで紹介するにいたる。現在、空気媒体のブロードバンド実現に向けて奮闘中。


INDEX
第1回:ネットワーク監視とは何をするのか
  はじめに
  L1〜L3のIP死活監視(IPインフラ部分の監視)
  ネットワーク監視ソフト
障害項目の詳細把握