\\\\ ٩( 'ω' )و ////

いろんな形がなかったりするものをこねてこねてこねまくります

2018-01-01から1年間の記事一覧

Prometheusとdcgm-exporterを使ってGPUの監視をする

Prometheus を使うとなったとき、 node-exporter を使ってマシンの CPU 使用率やメモリの使用量を監視すると思います。 しかし、GPU の監視をしようとしたとき、node-exporter だけでは GPU のメトリクスを取ることができません。 そこで NVIDIA/gpu-monitor…

Ubuntu 16.04にNVIDIAドライバをインストールしようとしたらハマった話

研究室にある深層学習マシンのNVIDIAドライバがおかしくなったので再インストールしたんですが、その時にどハマりしたので書いておきます。 先に結論 結論から言うとインストールCDで入るカーネルが古すぎることが原因でしたので、カーネルを4.13.0に上げる…