TOPサーバ構築・運用> システムに起こったことを監視する
Hinemos
運用管理ツール「Hinemos」完全利用ガイド

第3回:Hinemosを利用した運用監視で何が把握できる?

著者:NTTデータ  宮本 洋輔   2006/12/25
前のページ  1  2  3
システムに起こったことを監視する

   監視対象のサーバでシステム障害時や正規の運用と異なる操作が行われた場合に出力されるログを監視することで、システム障害や不正なアクセスなどを早い段階で認識することができます。

   例えば、監視対象のサーバでDISK障害が発生した場合には、以下のようなログが出力されます。
kernel: I/O error: dev 08:00, sector 0

   このようなログが出力されたら、メッセージ通知するように設定することができます(図8)。

「I/O error」を監視する設定例
図8:「I/O error」を監視する設定例
(画像をクリックすると別ウィンドウに拡大図を表示します)

   このメッセージを監視することで、DISKの障害を迅速に把握することができます。このログが出力されてもすぐにDISKが読み出し不能にならない場合もあるので、不調ではあるがまだ読み出しが可能な状態で、DISKの交換などの対処ができることもあるでしょう。

   なおシステムの運用中に監視しなければならないことは障害だけとは限りません。Linuxでは、ユーザの認証に失敗すると以下のようなエラーが表示されます。

sshd(pam_unix)[1905]: authentication failure; logname= uid=0 euid=0 tty=ssh ruser= rhost=host1 user=root

   このようなログが不自然に多く出力されている場合には、正規のユーザでない誰かが管理対象のマシンにアクセスしようとしている可能性があります。このメッセージを監視対象とすれば、実行しているアクセス元の解析など不正アクセスをされる前に措置をとることが可能です。

   このようにHinemosでは、今までオープンソースソフトウェアの運用監視ツールでは実現できなかったいろいろな運用監視項目を統一的に監視することができるようになります。これにより管理者はシステムの障害や障害に繋がる事象に対して、迅速で効果的に認識することができ、運用保守負荷の低減を実現することができます。


Hinemosの導入にあたってのまとめ

   今回の連載を通して、Hinemosを採用した場合にどのような運用管理が可能になるか理解できたと思います。Hinemosには、本連載で紹介した機能のほかにも、リソース情報を収集しグラフを作成する機能や、管理対象のノードに一度に操作を実行する機能など、効率的に管理を行うための機能を数多く有しています。機能に関する情報はSoueceForgeのHinemosサイトなどに公開していますのでご覧ください。

SourceForge.jp プロジェクト:Hinemos
http://sourceforge.jp/projects/hinemos/

   また、連載を通してHinemosに興味を持たれた方はぜひ試してみることをお勧めします。環境の準備ができない方のために、実際にHinemosに触れる「Hinemos ver2.1 ハンズオンセミナ」を無料で開催していますので奮ってご参加ください。

前のページ  1  2  3


株式会社NTTデータ  宮本 洋輔
著者プロフィール
株式会社NTTデータ  宮本 洋輔
基盤システム事業本部 オープンソース開発センタ
2003年、株式会社NTTデータに入社。入社以来セキュリティや運用管理などのシステム管理OSSに関する研究開発に従事。現在はHinemosの開発とコミュニティ作りに活動している。


INDEX
第3回:Hinemosを利用した運用監視で何が把握できる?
  運用管理のもう1つの肝:運用監視
  障害発生!そのときどこを見る?
システムに起こったことを監視する