ニュース

FPT GPU Cloud ベンチマーク:AI・機械学習向けGPUの性能比較(2025年3月)

ベンチマークは、AIや機械学習におけるGPU性能を評価する上で非常に重要です。 

本調査では、さまざまなGPUタイプでのトレーニング速度やスケーラビリティ(拡張性)を測定し、利用者が自分の用途に最適なGPUを選べるようサポートします。 

社内評価だけでなく、FPT GPU Cloudの性能を同等の他社サービスと比較し、処理能力・メモリ帯域幅・スケーラビリティなどの主要な強みを明らかにしています。これにより、ユーザーはAI業務に最も効率的なGPUクラウドサービスを選択できます。 

FPT AI FactoryOptimum Habanaトレーナーコードのフォーク版もご覧ください。H100ベンチマークは、そのリポジトリの手順に従うことで再現可能です。 

以下のベンチマークは、HabanaOptimum Habana v1.7トレーナーコードを使い、NVIDIA HGX H100およびHGX H200の性能を他社サービスと比較評価しています。 

H100の結果 

1秒あたりのサンプル数):FPTMetal CloudK8SDGXVM(バッチサイズ54

Model 1 GPU 2 GPUs 3 GPUs 4 GPUs 6 GPUs 8 GPUs
Similar Vendor’s H100 80GB SXM 142.3 275 400.6 521.8 740.3 962.2
Compared to 1 GPU (times faster) 1.93 2.82 3.67 5.20 6.76
Metal Cloud – Bare Metal H100 80GB SXM 144.2 283.4 418.9 550.7 799.4 1056.3
Compared to Similar Vendor 101% 103% 105% 106% 108% 110%
Compared to 1 GPU (times faster) 1.97 2.91 3.82 5.54 7.33
FPT K8S H100 80GB SXM 143.8 282.4 417.0 546.7 792.8 1046.5
Compared to Similar Vendor 101% 103% 104% 105% 107% 109%
Compared to 1 GPU (times faster) 1.96 2.90 3.80 5.51 7.28
DGX H100 80GB SXM 143.8 282.2 417.2 547.7 793.4 1047.0
Compared to Similar Vendor 101% 103% 104% 105% 107% 109%
Compared to 1 GPU (times faster) 1.96 2.90 3.81 5.52 7.28
FPT VM H100 80GB SXM (no nvlink) 143.0 261.7 376.6 459.5
Compared to Similar Vendor 101% 95% 94% 88%
Compared to 1 GPU (times faster) 1.83 2.63 3.21
Compared to Metal Cloud 99% 92% 90% 83%

H200の結果 

(1秒あたりのサンプル数):FPTMetal Cloud、バッチサイズ54、95、110  

Model 1 GPU 2 GPUs 3 GPUs 4 GPUs 6 GPUs 8 GPUs
Metal Cloud – Bare Metal H200 141GB SXM (bz54) 158.8 312.4 460.7 600.9 881.4 1165.1
Compared to Similar Vendor’s H100 112% 114% 115% 115% 119% 121%
Compared to Metal Cloud H100 110% 110% 110% 109% 110% 110%
Compared to Similar Vendor’s Baremetal H200 101% 101% 102% 101% 104% 105%
Compared to 1 GPU (times faster) 1.84 2.71 3.53 5.18 6.85
Metal Cloud – Bare Metal H200 141GB SXM (bz95) 169.4 332.9 489.2 649.7 917.4 1238.1
Compared to Similar Vendor’s H100 119% 121% 122% 125% 124% 129%
Compared to Metal Cloud H100 117% 117% 117% 118% 115% 117%
Compared to Similar Vendor’s Baremetal H200 107% 108% 108% 110% 108% 112%
Compared to 1 GPU (times faster) 1.96 2.87 3.82 5.39 7.28
Metal Cloud – Bare Metal H200 141GB SXM (bz110) 173.9 341.4 505.8 651.0 973.7 1190.0
Compared to Similar Vendor’s H100 122% 124% 126% 125% 132% 124%
Compared to Metal Cloud H100 121% 120% 121% 118% 122% 113%
Compared to Similar Vendor’s Baremetal H200 110% 111% 112% 110% 115% 107%
Compared to 1 GPU (times faster) 2.01 2.97 3.83 5.72 6.99

FPT AI Factoryは、先進的なインフラとソフトウェア最適化により、GPU性能を最大化しています。 

  • Metal Cloudは、全てのGPU構成で最高の性能を発揮し、他社のベンチマークを上回っています。特にGPU数が増えるほど性能差が拡大し、8GPUでは最大110%の差が見られます。  
  • FPT K8Sは、追加のオーバーヘッドがあるため若干性能が下がりますが、それでも十分競争力があります。  
  • FPT VM(NVLinkなし)は、特に複数GPU環境で性能が低く、NVLinkが拡張効率に与える重要な役割が確認できます。  
  • 全てのモデルにおいて、GPU数が増えるほど性能の伸びは鈍化します(サブリニア)。ただし、Metal Cloud8GPU7.33倍のスケーリングと最も高い拡張性を示しました。一方、HGX H200は大容量VRAM(141GB80GB)と高いメモリ帯域幅(4.8TB/s3.35TB/s)により、より大きなバッチサイズを扱え、最大バッチサイズではH100より最大18%高い性能を実現しました。  

FPT AI Factoryのサービス詳細はこちらをご覧ください。 

FPT AI Factoryに関するご相談・お問い合わせ: 

ホットライン:0800-300-9739
メール:support@fptcloud.jp  

この記事: