Linux

ZabbixでLinuxリソースの使用状況の監視(Linux by Zabbix agent)

*記事内に商品プロモーションを含む場合があります

ZabbixでLinuxサーバーのOSリソース使用状況を監視する基本機能の紹介です。

・CPU
・メモリ
・ディスク
・ネットワーク

Zabbixは監視だけではなく、サーバの性能低下の分析などにも使えます。

突然遅くなったとか、3か月前より遅くなったとか言われても手がかりがありませんよね。

Zabbix標準のテンプレート「Template Linux by Zabbix agent」を利用します。

Zabbix 6.0で動作確認していますが、Zabbix 7.0も同じやり方です。

Linuxサーバ OSリソース監視

Linuxサーバ OSの基本の監視項目のダッシュボードを作成します。

・CPU負荷
・空きメモリ
・ディスク read/write数
・ネットワークの送受信

OSリソースの基本のメトリクスの完成形です。

監視項目(メトリクス)の探し方

Linux by Zabbix agentなどの標準のテンプレートにも大量の監視項目が存在し、自分の目的の監視項目を探すことが大変です。

また、監視項目名(メトリクス)が慣れないと分かりにくいです。

例えば、ネットワーク関連は「interface」です。
(V4ぐらいのころは、”network”でした)

最新データを表示

Linux by Zabbix agentなどのテンプレートが適用されている状態で説明します。

「監視データ」-「最新データ」を選択して、監視項目を表示させます。

最新の値“に数値が入っていない場合は、監視対象のマシンのデータが取得できていません。

フィルタ機能を使う

ディスク関連 Disk のデバイスを名を選択

画像のサーバのディスクのデバイス名は “vda” です。マシン環境によって変わります。

ネットワーク関連 interface のデバイスを名を選択

画像のサーバのディスクのデバイス名は “enp1s0″です。マシン環境によって変わります。

細かい内容はヘルプで確認しましょう。

「?」マークにマウスのカーソルを持って行くと表示されます。

Linux OS リソース基本のメトリクス

以下の項目を設定して、調査や分析に足りないものを追加していく感じです。

CPU関連
Linux: CPU iowait time
Linux: CPU system time
Linux: CPU system time

メモリ
Linux: Available memory

ディスク関連 read/write数
vda: Disk read rate
vda: Disk write rate

ネットワーク関連
Interface enp1s0: Bits received
Interface enp1s0: Bits sent

テンプレートLinux by Zabbix agent のactiveありの違い

Linux by Zabbix agent と Linux by Zabbix agent active の似たような名前のテンプレートが存在します。

Linux by Zabbix agent

Linux by Zabbix agent:
(1)受動的チェック(Passive Checks)を使用

(2)Zabbixサーバーがエージェントにデータを要求し、エージェントはそのリクエストに応じてデータを返信

(3)通常、エージェントはサーバーの指示に従って動作

Linux by Zabbix agent active

Linux by Zabbix agent active:
(1)能動的チェック(Active Checks)を使用

(3)エージェントが自らサーバーから監視項目のリストを取得し、そのデータを定期的にサーバーに送信

(3)これにより、エージェントはサーバーとの通信が途切れても独立してデータを収集し続けることが可能

この違いにより、ネットワークの設定や監視の要件に応じて、どちらのテンプレートを使用するかを選択できます。

どちらも同じ監視結果を提供しますが、通信の方法が異なるため、環境に応じた選択が必要です。

ちなみに、Linux by Zabbix agent active を使わないとうまくデータが取得できないことがありました。

まとめ

Zabbixを使いこなせると監視だけでなく、サーバの性能劣化の分析などにも使えます。

ダッシュボードもいろいろな形式のグラフを簡単に作成できるので重宝します。

とりあえず、Zabbix agentを設定してZabbixサーバにデータが溜まるようにしておきましょう。

何かトラブルが発生した時に、後からダッシュボードを作成して分析可能です。