Debian Stretch 9.3.0で以前に行ったZabbixの温度監視設定を修正します。 まとめて複数コアを監視するのではなく、個別監視とします。

修正する項目

以前Zabbixでサーバー監視態勢を整えましたが、運用して修正したい点が出てきたので修正しておきます。

CPU Coreの温度通知

現在、CPU Coreの温度通知は以下のトリガーで行っています。

{Zabbix server:sensor[coretemp-isa-0000, temp1].last(#3)}>50 or
{Zabbix server:sensor[coretemp-isa-0000, temp2].last(#3)}>50 or
{Zabbix server:sensor[coretemp-isa-0000, temp3].last(#3)}>50

現在の通知メッセージ内容では、問題のあった値をItem values: {ITEM.NAME1}: {ITEM.VALUE1}として通知しています。 ただ、これだとtemp1しか通知されません。 他のトリガーだとアイテムとその値は1つずつしか検知していないみたいなので、 CPUの温度検知もCoreごとにトリガーを1つずつに分けたほうがよさそうです。

また、1コア単体で1分程度50℃超えることがちょこちょこありました。 この程度だったら問題ないのか疑問に思ったので、改めてCPUの適正温度を考えてみます。 i3-7100のスペックシートを確認してみます。

i3-6100だとTcase 65℃(最大許容温度)が記載されているのですが、i3-7100では記載されていません。 代わりにTjunction(接合部で許容できる最大温度)が100℃になっています。 適正な設定温度は結局よくわからいませんでしたが、とりあえず今回は6100の値を考慮して55℃に修正しました。 lm-sensorsのtemp_maxは80, temp_critは100だったので、この辺り見つつ今後も調整する感じでいきます。

修正を行った結果の設定としては次のようになります。 以前のトリガーを削除し、設定→ホスト→トリガーで新たにトリガーを3つ作成。 対応は次の通りになります。

トリガー名 条件式
Core temperature {Zabbix server:sensor[coretemp-isa-0000, temp1].last(#3)}>55
Core 0 temperature {Zabbix server:sensor[coretemp-isa-0000, temp2].last(#3)}>55
Core 1 temperature {Zabbix server:sensor[coretemp-isa-0000, temp3].last(#3)}>55

まとめ

今回はZabbixの監視設定に関してCPUの温度監視をコアごとに個別監視として修正しました。