Linuxのオープンソースの監視ツール

Linuxのシステム監視運用をしていく上で監視は
重要な作業なのだ。
監視で事前にトラブルを防ぐ事もシステムの癖?
みたいな物が見えてくる。
例えば、毎時同じ時間帯に異常なトラフィック量
が増え、調査の後、意味のあるトラフィック増と
分かれば、今後監視の上で除外できるし、トラブル
発生後に監視していたデータでトリガーを追求する
事が出来る事もあるし。
そんな訳で、この間のセミナーでいくつかのオープン
ソースの監視ツールを紹介されたのでメモ書き。

■Nagios(ナギオス)
世界的に良く知られているツールの1つらしい。
(私は使った事ないですけど・・・)
総合的な監視ツールらしく、ホスト数が多くても
対応出来、利用実績が豊富らしい。
まぁ、難点としては少し見にくいらしい。
http://www.nagios.org/

■Hinemos(ヒネモス)
NTTデータが中心になって開発した総合運用ツール
らしい。(ヒネモスを変換して初めて知ったけど、
ヒネモスって終日という意味があるらしい。調べた
ところ、「朝から晩まで続くさま」で、ヒネモスと
名づけたとの事。へぇー。)
エージェント型で専用クライアントツールを利用
するらしい。
JAVAで動作するのでメモリを食うのが難点らしい。
http://www.hinemos.info/

■ZABBIX(ザビックス)
最近注目の総合運用ツールで、シンプルだけど
必要な機能が揃っているツールらしい。
http://www.zabbix.com/

■zither(チーター)
ライブドアが提供する監視ツールらしい。
無料サービス「データホテルパトロール」が
なかなか優れ物らしいが、監視サーバがデータ
ホテル側にあるのでセキュリティポリシー的に
難しいかな。
http://patrol.datahotel.ne.jp/

まぁ、あとは言わずとしれてMRTGとか。

こんな感じかな〜。

| | コメント (11) | トラックバック (0)

Linuxシステム運用

今日はセミナーに行って来た。
そこで学んだ事をメモ書き。

システム運用にも多々あるが、サーバ監視として主に
使われるコマンドが、
死活監視のプロセス監視でpsコマンド、prtreeコマンド
ポートチェックとしてnetstatコマンド
リソース管理のCPU利用状況でtopコマンド、uptimeコマンド
メモリの利用状況は、freeコマンド
ディスクの利用状況は、dfコマンド、iostatコマンド
リソース全体を把握するのは、vmstatコマンドやsarコマンド

いろいろなコマンドがあるが、topコマンドの出力結果の中に
load averageという項目があるが、講師の人から明確にload average
を説明できるのか問われたが。。。明確に説明できない私。

なんとなくCPUの使用率という認識だったけど、正確には
処理を待っているプロセスの平均数。
まぁ、処理待ちのプロセスが少なければいつでもCPUが使用
できるのだから、CPUの使用率という認識で問題ないと思うけど。
処理を待っているプロセスの平均数が常に高い数値(5とか6)を
示している場合、処理待ちの状態が継続している状態で
システム的には宜しくない状態という事。

ちなみに、macで取得したtopコマンドの出力結果は・・・
↓こんな感じ。まぁ、問題ないなー。

Processes:  53 total, 2 running, 51 sleeping... 161 threads            23:15:48
Load Avg:  0.15, 0.17, 0.11     CPU usage:  2.3% user, 5.4% sys, 92.3% idle 
SharedLibs: num =  135, resident = 28.1M code, 4.01M data, 7.48M LinkEdit
MemRegions: num =  5031, resident =  149M + 14.2M private,  106M shared
PhysMem:   178M wired,  166M active,  347M inactive,  693M used,  330M free
VM: 7.41G + 81.5M   37612(0) pageins, 0(0) pageouts

  PID COMMAND      %CPU   TIME   #TH #PRTS #MREGS RPRVT  RSHRD  RSIZE  VSIZE
  313 top         10.1%  0:37.11   1    18    20   632K   840K  2.49M  27.0M
  307 csh          0.0%  0:00.02   1    15    19   408K  1.04M  1.46M  31.1M
  305 bash         0.0%  0:00.01   1    14    16   220K  1.21M  1.27M  27.1M
  304 login        0.0%  0:00.01   1    16    40   176K   920K  1.88M  26.9M
  302 Terminal     0.8%  0:02.23   4    95   185  3.09M  15.4M  17.9M+  358M
  301 nmbd         0.0%  0:00.13   1    14    23   260K  1.38M  3.38M  27.7M
  298 firefox-bi   0.2%  0:55.45   7   131   394  54.3M  40.6M  87.5M   482M
  297 Preview      0.0%  0:00.58   2    93   187  2.63M  11.1M  14.8M   355M
  291 System Eve   0.0%  0:00.26   1    60   105  1.34M  3.96M  8.89M   328M
  288 LAServer     0.0%  0:15.19   1    58   149  26.5M  11.0M  40.2M   396M
  287 usbmuxd      0.0%  0:00.01   2    20    21   176K   792K  1.79M  27.0M
  285 LCCDaemon    0.0%  0:00.40   3    98   157  2.32M  6.92M  12.5M   340M
  284 DevDetectL   0.0%  0:00.81   2    68   120  4.34M  9.32M  19.3M   400M
  283 UniversalA   0.2%  0:01.48   1    62   112  1.34M  4.04M  9.82M   333M
  282 iTunesHelp   0.0%  0:00.07   2    55   100   636K  3.09M  4.32M   324M
  280 Finder       0.0%  0:00.85   3   115   207  3.77M  20.9M  18.8M   375M
  278 SystemUISe   0.0%  0:02.79   2   207   228  4.19M  11.1M  16.9M   358M
  277 Dock         0.0%  0:00.34   2    96   144  1016K  13.3M  10.2M   337M
  276 mdimport     0.0%  0:00.32   3    60    50   988K  3.41M  9.05M  39.1M
  270 pbs          0.0%  0:00.31   2    53    44   764K  3.45M  5.79M  54.4M
  269 TabletDriv   0.0%  0:00.19   3    87    87   972K  3.73M  7.78M   325M
  268 mdimport     0.0%  0:00.18   3    60    43   836K  2.91M  6.75M  38.6M
  253 automount    0.0%  0:00.01   3    39    30   308K  1.30M  1.09M  28.7M

| | コメント (0) | トラックバック (0)

«ルーティング消したら。。。(汗)