現在、Stable Diffusion(SD)で画像を生成するなら、「GeForce RTX 3060 12G」(RTX 3060 12Gバイト)搭載のグラフィックボードを購入するのが定番だ。しかし、RTX 3060 12Gバイトでたくさん画像を生成していると、遅く感じてくる。そんなときは、思い切って「GeForce RTX 4070 Ti SUPER 16G」(RTX 4070 Ti SUPER 16G)搭載のグラフィックボードに乗り換えるのがおすすめだ。
RTX 3060 12Gバイトから一気にRTX 4070 Ti SUPER 16Gバイトへ


選定基準は処理速度は2倍、グラフィックメモリーは16Gバイト以上
現在利用しているグラフィックボードはASUSの「TUF-RTX3060-O12G-V2-GAMING」(RTX 3060 12Gバイト)。購入するグラフィックボードは、RTX 3060 12Gバイトを基準に、処理速度が2倍、グラフィックメモリーは16Gバイトだ。
処理速度が2倍というのは、体感できる速度。例えば、生成処理が1.3倍程度に向上しても分かりにくい。しかし、生成時間が2分の1になればベンチマークで測定しなくても、速くなったと感じられる。体感速度は重要だ。
また、グラフィックメモリーが16Gバイトというのは、Stable Diffusion XL(SDXL)が快適に動作する容量とされている。Webで明示はされていないようだが、Stable Diffusion 1.5(SD 1.5)と比較すると16Gバイトが目安だ。
そこで、処理速度の比較として、ドスパラの「グラフィックボード性能比較」を参考にした。

現在、利用しているのはRTX 3060 12Gバイトで性能目安は2,322だ。ここから2倍だと4,644となる。その中で、RTX 4080 SUPER、RTX 4080、RTX 4070 Ti SUPERの性能はほぼ同じ。一番価格が安いRTX 4070 Ti SUPERのグラフィックボードを選んだ。
SDXL向けにグラフィックボードを購入したら、「Stable Diffusion 3 Medium」「FLUX.1」がリリースされた
このようにグラフィックボードを比較して、購入、レビューを書いていたらSDXLの後継である「Stable Diffusion 3 Medium」(SD3M)と、Stable Diffusionの開発者が「FLUX.1」をリリースした。
SDで多く使われているUIである「Stable Diffusion WebUI Forge」(WebUI Forge)がFLUX.1をサポートしたため。早速、使ってみた。しかし、設定や適切なモデルがまだよく理解できない。FLUX.1は、設定によりSDXLよりグラフィックメモリーが少なくても動作するらしいなどと話を聞いた。それなら、RTX 4070 iT SUPER 16Gバイトでも実用的に使える可能性はある。
生成AI、特にSDを取り巻く環境は、これまでのITとは比べものにならないほど進化が速い。それを感じたのは、WebUI Forgeがリリースされた時。メモリーの管理の改良により、使用量が減少。高速化にも寄与した。
FLUX.1の情報はまだ少ないが、仮に「FLUX.2」がリリースされたら、WebUI Forgeと同様に一気に2倍の高速化されることも十分考えられる。RTX 4070 iT SUPER 16Gバイトでも、快適に動作する技術もすぐに出てくるだろう。
グラフィックメモリーが16Gバイトのグラフィックボードは価格が高い
SD用のグラフィックボードの選定で困るのは、グラフィックメモリーの容量だ。NVIDIAでは、16Gバイト以上のグラフィックメモリーを搭載しているグラフィックチップは7種類、揃えている。さらに、グラフィックメモリーが大きいチップは、各シリーズの上位モデルに限られるという点もある。
このようにグラフィックメモリーを考慮して、予算別に条件に合いそうなグラフィックボードを選定した。まずはRTX3060 12Gバイトを購入し、ミニマムスタート。RTX3060 12Gバイトは、中古品で3万円以下で販売されていることもある。
物足りなくなったら、一気に上位モデルのRTX 4070 Ti SUPER 16Gバイトを購入するというのが適切だろう。
しかし、RTX 4070 Ti SUPER 16Gバイトを搭載したグラフィックボードは12万円程度から。1つ下のクラスはRTX 4060 Ti 16Gバイトで、7万円程度から購入できる。RTX 4060 Ti 16Gバイトは、RTX 4070 Ti SUPER 16Gバイトと比べると、ベンチマークは2倍から1.5倍の差があるため、予算は10万としたもののRTX 4070 Ti SUPER 16Gバイトを搭載する「GeForce RTX 4070 Ti SUPER JetStream OC 16GB」を購入した。
- GeForce RTX 4070 Ti SUPER 16Gバイト:13~14万円



- GeForce RTX 4060 Ti 16Gバイト:7~8万円

- GeForceRTX 3060 8Gバイト:4~6万円

本当に2~3倍の性能の差があるのか?ベンチマークを実施
実際にRTX 4070 Ti SUPER 16Gバイトを搭載した「GeForce RTX 4070 Ti SUPER JetStream OC 16GB」グラフィックボートを購入。ベンチマークで性能を測った。
「CINEBENCH」では3倍


CONEBENCHで測定すると、RTX 3060 12Bバイトの場合、GPU(System)は7080ptsだ。

RTX 4070 Ti SUPER 16Gバイトを搭載した「GeForce RTX 4070 Ti SUPER JetStream OC 16GB」のベンチマーク。スコアは21824ptsで、RTX 3060 12Gバイトと比較すると、約3倍のスコアが確認できる。
Stable Diffusionの画像生成は約3倍
グラフィックボードは、Stable Diffusionでの画像生成を高速化させたいために購入した。2倍をめどに購入したが、画像の生成は3倍程度に向上した。
プロンプト
masterpiece,photo,8K,HDR,realistic,japanese girl,school uniforms,posing,
.AF-S NIKKOR 300mm f/2.8G ED VR II,
ネガティブプロンプト
nsfw,(worst quality, low quality:1.4),make up,Multiple people
設定
バッチ回数:10
バッチサイズ:2
(合計20枚)
幅と高さ:768×768
リサイズは:2
(実際1,536×1,536)
の条件で20枚の画像を生成する時間を測定すると、
RTX 3060 12Gバイト:33分12秒
RTX 4070 Ti Super 16Gバイト:10分44秒
となった。
各種ベントマークの結果では3倍という結果が出たが、Stable Diffusionでも同様の高速化が体感できる。

使用PC
※ベンチマーク使用PC
自作
グラフィックボード:RTX 4070 Ti SUPER 16Gバイト
CPU:Intel Core i5-13400
メモリー:32Gバイト(PC5-38400)
SSD:1Tバイト(WD_Black SN770 NVMe WDS100T3X0E)
マニュアルが見つからない
RTX 4070 Ti Super 16Gバイトを搭載しているグラフィックボードは多い。価格.comで調べると、玄人志向より数百円ほど安いメーカーがあった。「Palit Microsystems」だが、聞き覚えがない。Palit Microsystemsは、ドスパラのみで販売しているメーカーだった。このPalit Microsystemsで「GeForce RTX 4070 Ti SUPER JetStream OC 16GB」を購入した。
到着したグラフィックボードの箱を開けると入っていたのは、本体と電源ケーブルだけ。通常は、マニュアルやドライバーやソフトウェアが入ったCD-ROMが付いている。
Palit MicrosystemsのWebサイトを開くと、ドライバーとオーバークロックやファンをコントロールするソフトウェア、PDFファイルがダウンロードできた。しかし、このPDFファイルは、これらのソフトウェアがダウンロードができるURLが言語別に記載されているだけ。コストダウンにはつながるが、マニュアルが見つからないのは不便だ。

通常、箱を開けると、マニュアルやドライバ/ソフトウェアが収録されたCD-COMが入っている


三股ケーブルの使い方
1つ不明だったのは、3つに分かれた電源ケーブルの接続だ。ほかのグラフィックボードのマニュアルを参照した。これによると、3本のうち2本は電源ユニットのPCIeコネクタに挿し、残りのもう1本をグラフィックボードに挿すのが正しい。これは、グラフィックボードの消費電力が285Wのため、1本では電力が足りないことが原因だろう。
RTX 4070 Ti Super 16Gバイトを搭載したグラフィックボードは、確実にStable Diffusionの画像生成速度が向上する。ソフトウェアの設定でもある程度高速化するかもしれないが、グラフィックボードを買い替えるのが確実。







(右)「TUF-RTX3060-O12G-V2-GAMING」は、厚さ5.4mmで2.7スロット

(右)「TUF-RTX3060-O12G-V2-GAMING」の長さは30.1mm