ZabbixでLinuxサーバーのOSリソース使用状況を監視する基本機能の紹介です。
・CPU
・メモリ
・ディスク
・ネットワーク
Zabbixは監視だけではなく、サーバの性能低下の分析などにも使えます。
突然遅くなったとか、3か月前より遅くなったとか言われても手がかりがありませんよね。
Zabbix標準のテンプレート「Template Linux by Zabbix agent」を利用します。
Zabbix 6.0で動作確認していますが、Zabbix 7.0も同じやり方です。
Linuxサーバ OSリソース監視
Linuxサーバ OSの基本の監視項目のダッシュボードを作成します。
・CPU負荷
・空きメモリ
・ディスク read/write数
・ネットワークの送受信
監視項目(メトリクス)の探し方
Linux by Zabbix agentなどの標準のテンプレートにも大量の監視項目が存在し、自分の目的の監視項目を探すことが大変です。
また、監視項目名(メトリクス)が慣れないと分かりにくいです。
例えば、ネットワーク関連は「interface」です。
(V4ぐらいのころは、”network”でした)
最新データを表示
Linux by Zabbix agentなどのテンプレートが適用されている状態で説明します。
「監視データ」-「最新データ」を選択して、監視項目を表示させます。
“最新の値“に数値が入っていない場合は、監視対象のマシンのデータが取得できていません。
フィルタ機能を使う
ディスク関連 Disk のデバイスを名を選択
画像のサーバのディスクのデバイス名は “vda” です。マシン環境によって変わります。
ネットワーク関連 interface のデバイスを名を選択
画像のサーバのディスクのデバイス名は “enp1s0″です。マシン環境によって変わります。
細かい内容はヘルプで確認しましょう。
Linux OS リソース基本のメトリクス
以下の項目を設定して、調査や分析に足りないものを追加していく感じです。
CPU関連
Linux: CPU iowait time
Linux: CPU system time
Linux: CPU system time
メモリ
Linux: Available memory
ディスク関連 read/write数
vda: Disk read rate
vda: Disk write rate
ネットワーク関連
Interface enp1s0: Bits received
Interface enp1s0: Bits sent
テンプレートLinux by Zabbix agent のactiveありの違い
Linux by Zabbix agent と Linux by Zabbix agent active の似たような名前のテンプレートが存在します。
Linux by Zabbix agent
Linux by Zabbix agent:
(1)受動的チェック(Passive Checks)を使用
(2)Zabbixサーバーがエージェントにデータを要求し、エージェントはそのリクエストに応じてデータを返信
(3)通常、エージェントはサーバーの指示に従って動作
Linux by Zabbix agent active
Linux by Zabbix agent active:
(1)能動的チェック(Active Checks)を使用
(2)エージェントが自らサーバーから監視項目のリストを取得し、そのデータを定期的にサーバーに送信
(3)これにより、エージェントはサーバーとの通信が途切れても独立してデータを収集し続けることが可能
この違いにより、ネットワークの設定や監視の要件に応じて、どちらのテンプレートを使用するかを選択できます。
どちらも同じ監視結果を提供しますが、通信の方法が異なるため、環境に応じた選択が必要です。
ちなみに、Linux by Zabbix agent active を使わないとうまくデータが取得できないことがありました。
まとめ
Zabbixを使いこなせると監視だけでなく、サーバの性能劣化の分析などにも使えます。
ダッシュボードもいろいろな形式のグラフを簡単に作成できるので重宝します。
とりあえず、Zabbix agentを設定してZabbixサーバにデータが溜まるようにしておきましょう。
何かトラブルが発生した時に、後からダッシュボードを作成して分析可能です。