以前構築したマイニングおよびディープラーニング用のLinux自作PCですが、最近の気温の上昇に伴ってか、Logwatchのデイリーレポートの温度が上昇しているように見えます。

本記事ではZabbixを用いて3か月間の運用における温度や負荷を詳細に調査し、冷却対策などが必要かどうか検討します。

稼働状況

12月末にLinuxでマイニングおよびディープラーニング用の自作PCを構築しました。

この3か月にわたる運用は稼働時間から見ればほとんどがマイニングに占められていますが、マイニングにおけるGPU負荷はほぼ一定とみなせるので比較にはかえって都合がよいでしょう。

負荷がほぼ一定であるにも関わらずに温度上昇がみられるのであれば、おそらく気温の上昇と内部の埃が原因で、夏場の運用などはさらに冷却に気を配る必要があるでしょう。

埃は月一回程度でエアダスターを使って除去するにしても、冷却効率向上には限度があるでしょうし、ファンの増設なども考える必要があるかもしれません。

Zabbixの監視データ

対象となるLinux自作PCはZabbixによる監視を常時行っています。

ここでは、CPUとGPUの温度と負荷を1か月ごとに比較することにします。

CPU

以下に順に1月、2月、3月のCPU温度のグラフを載せます。

※1月1日の60℃超えはClamAVの設定ミスによるものなので今回は考察の対象外です。

以下の表に値をまとめます。

Core [℃] Core0 [℃] Core1 [℃]
1月 38.41 37.01 38.39
2月 38.8 37.43 38.76
3月 42.02 40.64 41.96

温度自体は1日の中で上下しており、おそらくこれは1日の気温推移が原因でしょう。

毎週月曜に行われているClamAVによるウイルス検査もそこまで大きな影響は与えていないものと思われます。

しかし、月ごとの平均値を比較してみると、1,2月の平均温度にはいずれのコアも大きな差はありませんが、3月になると平均温度が40℃を超えており、2~3℃程度上昇しています。

この上昇度合いだと、これから夏を迎えて気温が上がり始めるとさらに内部温度は上昇していく可能性が高いものと思われます。

GPU

次に、1,2,3月のGPU温度と負荷を比べてみましょう。

以下の表に値をまとめます。

GPU Temp [℃] GPU Fan [%]
1月 69.99 35.97
2月 70.21 36.3
3月 72.14 42.68

GPU温度とファンの負荷はほぼ連動して動いており、温度の安定性を見ると1,2月は波が小さいですが、3月は変化の波が大きくなっているようにも見受けられます。

さらに、1,2月と比べて3月はGPU温度も2℃ほど上昇するだけでなくファンの負荷も上がっており、明らかに熱処理が大きく増えています。

考察

Linux自作PCのエアフローは次に示す図の通りになっています。

前面のファン1つで吸気を行い、GPUのファン2つもケース下部から吸気を行っており、熱を持った空気がGPU上部→CPU→背面ファンと流れる構造になっています。

冷却に用いる空気は前面ファンから流入しますが、用いる空気は当然室温であるので気温が上昇すれば冷却効率は落ちます。

また、GPUで発生した熱はCPUを通るため、CPUの温度にも影響を与え、CPU・GPUともに3月における気温上昇で温度が上昇していると考えられます。

ただ、マシンの現状の運用ではGPU負荷はあってもCPU負荷はほとんどないはずなので、冷却効率を上げればCPUの温度は下がる可能性があります。

ここで、自作PCのエアフローを見直し、ファンの増設などで冷却効率を上げてこれからの気温上昇対策をとる必要がありそうです。

まとめ

  • 1,2,3月のCPUとGPUの温度・負荷をZabbixで比較した
  • 3月になって明らかに温度やファンの負荷が上昇している
  • 原因は気温の上昇が大きく寄与していると考えられる
  • これからの温度上昇を考えると冷却効率を上げる必要がありそう