Stable Diffusionでたくさん画像を生成したい!―RTX 3060 12G→4070 Ti SUPER 16Gで約3倍

4.5

Amazonのアソシエイトとして、buyTechは適格販売により収入を得ています。

 現在、Stable Diffusion(SD)で画像を生成するなら、「GeForce RTX 3060 12G」(RTX 3060 12Gバイト)搭載のグラフィックボードを購入するのが定番だ。しかし、RTX 3060 12Gバイトでたくさん画像を生成していると、遅く感じてくる。そんなときは、思い切って「GeForce RTX 4070 Ti SUPER 16G」(RTX 4070 Ti SUPER 16G)搭載のグラフィックボードに乗り換えるのがおすすめだ。

RTX 3060 12Gバイトから一気にRTX 4070 Ti SUPER 16Gバイトへ

::Palit Products - GeForce RTX™ 4070 Ti SUPER JetStream OC ::
ゲーマーズチョイスエッセンシャルデザイン | 性能に追求GeForce RTX™ 4070 Ti SUPER JetStream OCは、ジェットブラック色と幾何学的なブロックパターンによって構成された性能重視のデザインです。新しいGale Hunter Fanと幅広銅ベースにより、優れた冷却性能と低騒音を提供します。
Palit
¥133,480 (2024/08/14 13:53時点 | Amazon調べ)
\楽天ポイント4倍セール!/
楽天市場
グラフィックボード「GeForce RTX 4070 Ti SUPER JetStream OC 16GB」
グラフィックボード「GeForce RTX 4070 Ti SUPER JetStream OC 16GB」

選定基準は処理速度は2倍、グラフィックメモリーは16Gバイト以上

 現在利用しているグラフィックボードはASUSの「TUF-RTX3060-O12G-V2-GAMING」(RTX 3060 12Gバイト)。購入するグラフィックボードは、RTX 3060 12Gバイトを基準に、処理速度が2倍、グラフィックメモリーは16Gバイトだ。

 処理速度が2倍というのは、体感できる速度。例えば、生成処理が1.3倍程度に向上しても分かりにくい。しかし、生成時間が2分の1になればベンチマークで測定しなくても、速くなったと感じられる。体感速度は重要だ。

 また、グラフィックメモリーが16Gバイトというのは、Stable Diffusion XL(SDXL)が快適に動作する容量とされている。Webで明示はされていないようだが、Stable Diffusion 1.5(SD 1.5)と比較すると16Gバイトが目安だ。

 そこで、処理速度の比較として、ドスパラの「グラフィックボード性能比較」を参考にした。

ドスパラが公開している「グラフィックボード性能比較」
出所:ドスパラ(https://www.dospara.co.jp/5shopping/shp_vga_def_graph.html

 現在、利用しているのはRTX 3060 12Gバイトで性能目安は2,322だ。ここから2倍だと4,644となる。その中で、RTX 4080 SUPER、RTX 4080、RTX 4070 Ti SUPERの性能はほぼ同じ。一番価格が安いRTX 4070 Ti SUPERのグラフィックボードを選んだ。

グラフィックボード性能比較 2025/02/05更新【ドスパラ】 |ドスパラ公式通販サイト
グラフィックボード・ビデオカードの性能をGeForceシリーズ、Radeonシリーズ、内蔵GPU別にグラフでわかりやすく掲載した性能比較ページです。ビデオカード買換えの前に今お使いのものと最新のものとの比較にも役立ちます。

SDXL向けにグラフィックボードを購入したら、「Stable Diffusion 3 Medium」「FLUX.1」がリリースされた

 このようにグラフィックボードを比較して、購入、レビューを書いていたらSDXLの後継である「Stable Diffusion 3 Medium」(SD3M)と、Stable Diffusionの開発者が「FLUX.1」をリリースした。

GitHub - black-forest-labs/flux: Official inference repo for FLUX.1 models
Official inference repo for FLUX.1 models. Contribute to black-forest-labs/flux development by creating an account on GitHub.
最も洗練された画像生成モデル、Stable Diffusion 3 Medium のオープンリリースを発表 — Stability AI Japan
Stable Diffusion 3シリーズの最新かつ最も先進的なテキストから画像へのAIモデルであるStable Diffusion 3 Medium を発表します。

 SDで多く使われているUIである「Stable Diffusion WebUI Forge」(WebUI Forge)がFLUX.1をサポートしたため。早速、使ってみた。しかし、設定や適切なモデルがまだよく理解できない。FLUX.1は、設定によりSDXLよりグラフィックメモリーが少なくても動作するらしいなどと話を聞いた。それなら、RTX 4070 iT SUPER 16Gバイトでも実用的に使える可能性はある。

 生成AI、特にSDを取り巻く環境は、これまでのITとは比べものにならないほど進化が速い。それを感じたのは、WebUI Forgeがリリースされた時。メモリーの管理の改良により、使用量が減少。高速化にも寄与した。

 FLUX.1の情報はまだ少ないが、仮に「FLUX.2」がリリースされたら、WebUI Forgeと同様に一気に2倍の高速化されることも十分考えられる。RTX 4070 iT SUPER 16Gバイトでも、快適に動作する技術もすぐに出てくるだろう。

グラフィックメモリーが16Gバイトのグラフィックボードは価格が高い

 SD用のグラフィックボードの選定で困るのは、グラフィックメモリーの容量だ。NVIDIAでは、16Gバイト以上のグラフィックメモリーを搭載しているグラフィックチップは7種類、揃えている。さらに、グラフィックメモリーが大きいチップは、各シリーズの上位モデルに限られるという点もある。

 このようにグラフィックメモリーを考慮して、予算別に条件に合いそうなグラフィックボードを選定した。まずはRTX3060 12Gバイトを購入し、ミニマムスタート。RTX3060 12Gバイトは、中古品で3万円以下で販売されていることもある。

 物足りなくなったら、一気に上位モデルのRTX 4070 Ti SUPER 16Gバイトを購入するというのが適切だろう。

 しかし、RTX 4070 Ti SUPER 16Gバイトを搭載したグラフィックボードは12万円程度から。1つ下のクラスはRTX 4060 Ti 16Gバイトで、7万円程度から購入できる。RTX 4060 Ti 16Gバイトは、RTX 4070 Ti SUPER 16Gバイトと比べると、ベンチマークは2倍から1.5倍の差があるため、予算は10万としたもののRTX 4070 Ti SUPER 16Gバイトを搭載する「GeForce RTX 4070 Ti SUPER JetStream OC 16GB」を購入した。

  • GeForce RTX 4070 Ti SUPER 16Gバイト:13~14万円
パソコン工房 楽天市場店
¥141,450 (2024/08/15 15:49時点 | 楽天市場調べ)
\楽天ポイント4倍セール!/
楽天市場
Palit
¥133,480 (2024/08/14 13:53時点 | Amazon調べ)
\楽天ポイント4倍セール!/
楽天市場
  • GeForce RTX 4060 Ti 16Gバイト:7~8万円
  • GeForceRTX 3060 8Gバイト:4~6万円

本当に2~3倍の性能の差があるのか?ベンチマークを実施

 実際にRTX 4070 Ti SUPER 16Gバイトを搭載した「GeForce RTX 4070 Ti SUPER JetStream OC 16GB」グラフィックボートを購入。ベンチマークで性能を測った。

「CINEBENCH」では3倍

Cinebench
コンピュータのハードウェア性能を評価
CONEBENCHで測定すると、RTX 3060 12Bバイトの場合、GPU(System)は7080ptsだ。
Stable Diffusionでたくさん画像を生成したい!―RTX 3060 12G→4070 Ti SUPER 16Gで約3倍 44

  CONEBENCHで測定すると、RTX 3060 12Bバイトの場合、GPU(System)は7080ptsだ。

RTX 4070 Ti SuperのCINEBENCHのスコアは21824。RTX 3060 12Bバイトと比べると約3倍の差がある。
Stable Diffusionでたくさん画像を生成したい!―RTX 3060 12G→4070 Ti SUPER 16Gで約3倍 45

 RTX 4070 Ti SUPER 16Gバイトを搭載した「GeForce RTX 4070 Ti SUPER JetStream OC 16GB」のベンチマーク。スコアは21824ptsで、RTX 3060 12Gバイトと比較すると、約3倍のスコアが確認できる。

Stable Diffusionの画像生成は約3倍

 グラフィックボードは、Stable Diffusionでの画像生成を高速化させたいために購入した。2倍をめどに購入したが、画像の生成は3倍程度に向上した。

プロンプト

masterpiece,photo,8K,HDR,realistic,japanese girl,school uniforms,posing,
.AF-S NIKKOR 300mm f/2.8G ED VR II,

ネガティブプロンプト

nsfw,(worst quality, low quality:1.4),make up,Multiple people
設定
バッチ回数:10
バッチサイズ:2
(合計20枚)
幅と高さ:768×768
リサイズは:2
(実際1,536×1,536)
の条件で20枚の画像を生成する時間を測定すると、
RTX 3060 12Gバイト:33分12秒
RTX 4070 Ti Super 16Gバイト:10分44秒
となった。

 各種ベントマークの結果では3倍という結果が出たが、Stable Diffusionでも同様の高速化が体感できる。
Stable Diffusionでの出力
Stable Diffusionでの出力

使用PC

※ベンチマーク使用PC

 自作

 グラフィックボード:RTX 4070 Ti SUPER 16Gバイト
 CPU:Intel Core i5-13400
 メモリー:32Gバイト(PC5-38400)
 SSD:1Tバイト(WD_Black SN770 NVMe WDS100T3X0E)

マニュアルが見つからない

  RTX 4070 Ti Super 16Gバイトを搭載しているグラフィックボードは多い。価格.comで調べると、玄人志向より数百円ほど安いメーカーがあった。「Palit Microsystems」だが、聞き覚えがない。Palit Microsystemsは、ドスパラのみで販売しているメーカーだった。このPalit Microsystemsで「GeForce RTX 4070 Ti SUPER JetStream OC 16GB」を購入した。

 到着したグラフィックボードの箱を開けると入っていたのは、本体と電源ケーブルだけ。通常は、マニュアルやドライバーやソフトウェアが入ったCD-ROMが付いている。

 Palit MicrosystemsのWebサイトを開くと、ドライバーとオーバークロックやファンをコントロールするソフトウェア、PDFファイルがダウンロードできた。しかし、このPDFファイルは、これらのソフトウェアがダウンロードができるURLが言語別に記載されているだけ。コストダウンにはつながるが、マニュアルが見つからないのは不便だ。

「GeForce RTX 4070 Ti SUPER JetStream OC 16GB」の箱を開けた。通常、箱を開けると、マニュアルやドライバ/ソフトウェアが収録されたCD-COMが入っている
グラフィックボード「GeForce RTX 4070 Ti SUPER JetStream OC 16GB」の箱を開けた。
通常、箱を開けると、マニュアルやドライバ/ソフトウェアが収録されたCD-COMが入っている
箱を開けると、見えるのは本体とケーブルだけ。緩衝材を外してもマニュアルは見当たらない
箱を開けると、見えるのは本体とケーブルだけ。緩衝材を外してもマニュアルは見当たらない
緩衝材をめくってもマニュアルが出てこない。そのため、製品はこの2つだ
緩衝材をめくってもマニュアルが出てこない。そのため、製品はこの2つだ

三股ケーブルの使い方

 1つ不明だったのは、3つに分かれた電源ケーブルの接続だ。ほかのグラフィックボードのマニュアルを参照した。これによると、3本のうち2本は電源ユニットのPCIeコネクタに挿し、残りのもう1本をグラフィックボードに挿すのが正しい。これは、グラフィックボードの消費電力が285Wのため、1本では電力が足りないことが原因だろう。

 RTX 4070 Ti Super 16Gバイトを搭載したグラフィックボードは、確実にStable Diffusionの画像生成速度が向上する。ソフトウェアの設定でもある程度高速化するかもしれないが、グラフィックボードを買い替えるのが確実。

電源ユニットのソケット。左上には3つのコネクタがある
電源ユニットのソケット。左上には3つのコネクタがある
Stable Diffusionでたくさん画像を生成したい!―RTX 3060 12G→4070 Ti SUPER 16Gで約3倍 27
左上の3つのソケットのうち右側にも電源ケーブルを挿す
2本の電源ケーブルをグラフィックボードに付属していたアダプタに接続する
2本の電源ケーブルをグラフィックボードに付属していたアダプタに接続する
「GeForce RTX 4070 Ti SUPER JetStream OC 16GB」
「TUF-RTX3060-O12G-V2-GAMING」の重さは1088g
「GeForce RTX 4070 Ti SUPER JetStream OC 16GB」の重さは1478g
「GeForce RTX 4070 Ti SUPER JetStream OC 16GB」の重さは1478g
これほどまで重たいGeForce RTX 4070 Ti SUPER JetStream OC 16GBには、GPUアームは必須
これほどまで重たいGeForce RTX 4070 Ti SUPER JetStream OC 16GBでも、GPUアームは必須
Stable Diffusionでたくさん画像を生成したい!―RTX 3060 12G→4070 Ti SUPER 16Gで約3倍 28
(左)「GeForce RTX 4070 Ti SUPER JetStream OC 16GB」は、厚さ63.5mmで3.1スロット
(右)「TUF-RTX3060-O12G-V2-GAMING」は、厚さ5.4mmで2.7スロット
Stable Diffusionでたくさん画像を生成したい!―RTX 3060 12G→4070 Ti SUPER 16Gで約3倍 29
(左)「GeForce RTX 4070 Ti SUPER JetStream OC 16GB」の長さは328.9mm
(右)「TUF-RTX3060-O12G-V2-GAMING」の長さは30.1mm