OpenGLが速いグラボの選び方~ハイエンドGTXはローエンドのQuadroより遅い!?

 GeForceは写真や動画の編集に向かないという。クリエイター向けPCはQuadroが多い。ゲームと写真編集、両方やる人にとってQuadoは気になる存在。写真や動画をターゲットにGeForceとQuadoと比較した情報がほとんどない。そこで両者の実力を検証してみた。

 

テスト環境

 用意したビデオカードは次の通り。

いろいろなビデオカード

GeForce GTX1080(GIGABYTE)
GeForce GTX960(GIGABYTE)
Quadro K620(ELSA)
HD530 (corei5-6500内臓GPU)

実行環境はGTX1080だけCorei7-6700、他は記載なき限りCorei5-6500。メモリはそこがボトルネックにならない十分な量を搭載した。

 

 Quadro K620はクリエイーター向けBTOモデルでよく採用されているローエンドボード。GTX960に比べ貧祖に見える。上位のM2000にしても同じこと。

 

 ベンチマークソフトは、OpenGLや写真、動画の処理速度を比較できるものを用意した。

SPEC viewpref 12.1.1[1]
PCMark 8 Basic Edition 2.7.613 (Creative Accelerated 3.0使用)

 これらベンチマークはあくまで参考であり、グラフの結果が作業効率とイコールではないことに注意したい。
動画のエンコード速度の比較は以下を利用した。

TMPEGnc Video Mastering Works 5

 

テスト結果

 

まずはSPEC viewprefの結果。

各種ビデオカードのSPEC viewpref 実行結果をまとめたグラフ

グラフ1.SPEC viewprefの実行結果

 一部を除きGTX1080圧勝に見えるが、テストの中身を見るとそうでもない。例えばSolidWorks実行速度の目安を示す sw-03 の中身は次のようだ。

 

SPEC viewpref sw-03の詳細内容

グラフ2.SPEC viewpref sw-03の詳細

1~3. Vehicle in shaded mode , 4. Vehicle in shaded-with-edges mode , 5. Vehicle in wireframe mode , 6~7. Rally car in shaded mode , 9~10. Tesla Tower in shaded mode , 11. Tesla Tower in shaded-with-edges mode

 前半の3つを除き、多くのテストでK620が勝っている。
 全データは次を参照(クリックで拡大)。CAD系ソフトでも設計用はQuadro、デザイン用はGeforceが勝るようだ。個々のテストの詳細は文献2を参照してほしい。

SPEC viewpref 全データの詳細

グラフ3.SPEC viewpref 全データ詳細

 SolidWorksにはベンチマークソフトが付属していて結果が共有されている[3]。計算条件の違う結果が混在しているが、おおよそ次の関係があるようだ。

K620  > HD530 ≒ GTX960 ≒ GTX1080

 GeForceはグレードに関係なくCPU内臓グラフィクス(HD530)と大差ない。この結果は、グラフ2のテスト10,11と一致する。

 

 次にPCMark 8の結果を示す。見やすくするためHD530をスコア10として正規化してある。時間の結果については逆数をとりBetterの方向を合わせた。

各種ビデオカードのPCMark 8 実行結果をまとめたグラフ

グラフ4.PCMark 8 の実行結果 Acc=Accelerated , OpenCLは取付たGPUのドライバを使用(デフォルト)

 ゲームの能力だけGeForce系が飛びぬけて高い。GTX1080の最高点は天井を突き抜けて見えないが190ある。反面、ビデオや音楽関係のベンチではGeForce系が低い。個々のテストの詳細は文献4を参照してほしい。

 

動画のエンコード

TMPGEnc Video Mastering Works 5 のNVIDIA CUDA設定画面

 上の設定画面はTMPGEnc Video Mastering Works 5。エンコーダーにNVIDIAのCUDAを利用できるのでこれを有効にした。エンコード中CUDAが利用されると下のようにCPUとCUDAの利用比率が表示される。

CUDA を使ってエンコードしているときのステータス画面

 

 エンコードの対象ファイルはmp4の映画ファイル(1.7GB、2時間相当)を使用。この再エンコードにかかった時間はi5-7400の環境で約46分。これを基準にした速度比を次に示す。

表1.動画のエンコード速度比

  速度比 CUDA コア数
i7-6700 + GTX1080 1.7 2560
i7-6700 1.6 0
i5-4590 + GTX960  1.1 1024
i5-6500 + K620 1.0  384
i5-7400 1 (基準) 0

 速度比は基準を分子に置いて割った値なので数字が大きいほど速い。CUDAに手伝わせてもエンコードの速度は1割程度しかアップしなかった。i5とi7の違いからみて、エンコードの速度はGPUの能力はあまり関係なくCPUの能力(特にスレッド数)が速度アップに最も影響するようだ。

 

結論

1.CADや写真でGeForceは意味なし

 試しにGeForceを入れたPCでCAD操作をしても、CPU内臓グラフィックスと差が体感できない。GTX1080で大規模モデルを操作したときだけ、CPU内臓グラフィックスより多少マシな程度。

 CADや写真の用途においてGPUは大規模モデルのときの描画を助けるだけで、普段の体感速度はCPUの能力(コア、スレッド数)や搭載メモリ、ディスクI/O速度によって決まると考えていい。

 CADソフトによって一部機能が動作しない(例えばSolidWorksのRialViewはGeForceだと無効になる)。

 

2.CADや写真はローエンドのQuadroで十分

 Quadroを使うことでCADの大規模モデルで問題となる描画のストレスから開放される。Quadroにはいろんなグレードがあるが、写真や設計系CADではK620で十分。M2000はデザイン系CADの要求に見合うものと考えられる。

ELSA System GraphでGPUの負荷をモニターしている様子

 GPUの負荷はELSA System Graphでモニターできる。4K動画再生、大規模CADモデル操作などいろいろ実行してみたが、K620の能力を使い切る(GPU負荷が100%になる)ケースはほとんどなかった。

 

 

3.動画編集(エンコード)にGPUは役に立たない

 Quadroは表示速度のボトルネックを解消するが、動画編集で必要なエンコードの速度には寄与しない。この用途はCPUの能力(コア、スレッド数)で決まる。搭載メモリが少ないとそこがボトルネックになるので注意。

 

<参考購入先>
Quadroビデオカード
TMPGEnc Video Mastering Works 動画エンコードの定番ソフトです

<関連記事>
ディープラーニング用PCの作り方 安く作る方法 2019年版
CPUに付いている古いグリスの落とし方~エタノールは間違いだった!
あなたの知らないCPU放熱グリスの選び方~インテルCPUは隙間になる
あなたの知らないPCファンの選び方~風速計で適正動作を確認する
PCケースの選び方~スイッチ、エアフロー、構造など見るべきポイントを徹底解説!

<参考文献>
1. SPEC viewpref
3.SplidWorks Share Your Score
4.PCMark8ベンチマークのテクニカルガイド