nipplelfsblog

nipplelf’s blog

1週間に1記事を目標にして、考えたことや描いた絵について書いてます。

RTX4070でeGPU化にチャレンジ その2

生成AI用に勢いでRTX4070を買ってしまった。果たしてeGPU化はできるのだろうか?まずはGPUをパソコンにくっつけて動かそうと苦労した話

(今週の一枚)お芋集会🍠(pixiv

 

今回はRTX4070の起動試験のお話

RTX4070をパソコンに組み込む

 eGPU化する前にまずRTX4070(ASUS ProArt GeForce RTX™ 4070 OC edition 12GB GDDR6X)が普通の状態でちゃんと動くかどうかを確認することにした。今使っているRTX2080(EVGA GeForce RTX 2080 FTW3 Ultra Gaming Graphics Card)はとにかくラジエーターがデカイ。このくそデカヒートシンクのおかげでGPUとVRAMはばっちり冷えてよほどの処理をしない限りめちゃめちゃ安定して作業ができる。それと比べると今回購入したRTX4070のヒートシンクは貧弱だが、ケースの外に出して運用する予定なので、まぁなんとかなるだろう。

 さて、このGPUを入れ替えるわけだがPCの内部を軽く掃除して接続するPCIe/NVMeレーンの状態をRTX2080を外して目視で確認してみた。

①NVMe Windows用m.2 SSD占有

②PCIe4.0  グラフィックボード用(実はホックがちぎれている)

③PCIe3.0  空レーン(RTX2080装着時にサイズの関係で使用不可)

④NVMe    空レーン(Oculink変換コネクタを接続する予定)

⑤NVMe   m.2 SSD占有(生成AIを使う時に専用にする予定)

⑥PCIe3.0 空レーン(×1 レーンのみで次回eGPUを増やすときに使えるかも)

という感じだ。①②はCPU直リンク、その他はチップセットからになる。

とりあえず、②にRTX4070を装着する。

 3連ファンだけどだいぶスリムで8pinも1本だけなのですっきりした。また、GPUを挿しても③レーンが見えるので今後何かに使えるかもしれない。

 

RTX4070を動かしてみるが・・・

 さて、うまくつけられたと思うので、早速Windowsから起動だ。どんな感じかなぁ・・・と思っていると画面にブロックノイズ❣!❕!❕!❕!❕!❕!❕!❕!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!ああああああああああああああああああああああ;でぇいgらおえいhごあいhg

 あまりの衝撃で冷や汗が出た。冷静に、冷静に、DPケーブルの挿しが甘いかドライバーが古かったせいかもしれないと思いなおして、別コネクタにケーブルを挿し、最新ドライバー572.83(後述するがこれは入れてはいけない)をインストールするとノイズがなくなってほっと一息である。

 

 次にしっかり機能するか見るためにベンチマークソフトを動かすことにした。

 ・・・は?なにこれ?めまいがした。動くには動いているが、全く性能を発揮していない。3DMARK側のスコアが特に低く、すべての領域において低性能だ。いったい何なんだ。

 こらヤバイということで、色々調べることになった。まず、既存のPC側がボトルネックとなって性能が低下しているかもしれないので、RTX2080に戻して各種チェックをしたが、全く問題がなかった。また、グラフィックボード以外のどれかが情報転送のボトルネックになっている可能性もあり色々チェックしたが、エラーも出ず、性能的にそこまでの機能低下の原因ではないことが分かった。そのため、RTX4070に何らかの欠陥があることになる。

 ある程度スコアに余裕があるFF15ベンチマークでもう少し高負荷でチェックをすることにした。その際、物理的な問題とWindows側の問題を切り分けるためにHWMonitorで各機器の電圧と温度を見ながらベンチマークチェックを行った。

 その他機器の指標には特に異常はなかったが、やはりRTX4070には問題があった。赤四角で囲った部分を見てわかるようにGPU用電圧が規定値(0.91V~1.10V)なのに温度上昇がなく最大電力量も100W強で止まっている。本来、このグラフィックボードは定格200Wまで上がる。電力消費が半分で機器でサーマルスロット(熱停止)が起こるような状態にもならないまま、性能が十分に出ていないことが分かった。表面的にしっかり動いているが異常放熱やGPU/VRAM直下の電源周りの問題(昇圧・高圧、電源供給)ではないとわかる。

 つまり、制御ソフト側から機能制限をされているのだ。そうするとWindows? かNVIDIA ドライバ?その辺を調べてみた。

 

解決法

 結論だけを書くとドライバの問題だった。

www.youtube.com

 このおっさんの動画が一番詳しく解説しているが、どうも最新のドライバではRTX5000番台に著しい問題が発生しており、それをどうにかしようと揉めている最中のようだ。その余波が4000番台にも来てしまい、自分の場合は電力制限されて性能が出ないことになったみたいだ。

 上のベンチマークで使ったドライバのバージョンが572.83で、そいつを入れるとブルースクリーンや再起動を連発するそうだ。このおっさんが言うには前バージョンまでこんなことはなかったので、5000番台の新機能とディスプレイの周波数制御に失敗してこんなことになっているそうだ。DPケーブルの差口を変えると問題が発生するのは面白い発見だと思う。また、前バージョンに戻せば問題は落ちつく(完全になくなるとは言わない)ということだ。

 藁にもすがる思いで、おっさんが推奨する前バージョンの566.36にすることにした。その結果が下になる。

 成功!なんとかなった!定格近くまで電力量が上がり、PCIe、8pin両方から安定的に電力供給がされた。それに伴ってGPU・VRAMの温度も上昇した。そして、ベンチマークも通常のRTX4070と同等まで上昇した(12581→16461)。これは3DMARKでも確認できた(2145→3743)。

 また、その際のグラフィックボード内部の温度はホットスポットでも85度以下となり、このヒートシンクでもなんとか冷却を維持できることを確認できた。そのため、eGPU化しても問題ないと思う。

 

 あ~~~~~~~~よかった。

 

終わりに

 他にも色々チェックをやったり別種のベンチや診断ツールを回したりしたけど、ここではぐちゃぐちゃになるので書かない。とにかくちゃんと動いてよかった。

 まさかeGPU化云々の前段階で心が折れそうになるとは思わなかった(;´Д`)

 次回はついにeGPU化である。

 

その3に続く

COPYRIGHT Nipplelf ALL RIGHTS RESERVED.