FPT GPU Cloud ベンチマーク：AI・機械学習向けGPUの性能比較（2025年3月）

ベンチマークは、AIや機械学習におけるGPU性能を評価する上で非常に重要です。

本調査では、さまざまなGPUタイプでのトレーニング速度やスケーラビリティ（拡張性）を測定し、利用者が自分の用途に最適なGPUを選べるようサポートします。

社内評価だけでなく、FPT GPU Cloudの性能を同等の他社サービスと比較し、処理能力・メモリ帯域幅・スケーラビリティなどの主要な強みを明らかにしています。これにより、ユーザーはAI業務に最も効率的なGPUクラウドサービスを選択できます。

FPT AI FactoryのOptimum Habanaトレーナーコードのフォーク版もご覧ください。H100ベンチマークは、そのリポジトリの手順に従うことで再現可能です。

以下のベンチマークは、HabanaのOptimum Habana v1.7トレーナーコードを使い、NVIDIA HGX H100およびHGX H200の性能を他社サービスと比較評価しています。

H100の結果

（1秒あたりのサンプル数）：FPTのMetal Cloud、K8S、DGX、VM（バッチサイズ54）

Model	1 GPU	2 GPUs	3 GPUs	4 GPUs	6 GPUs	8 GPUs
Similar Vendor’s H100 80GB SXM	142.3	275	400.6	521.8	740.3	962.2
Compared to 1 GPU (times faster)		1.93	2.82	3.67	5.20	6.76

Metal Cloud – Bare Metal H100 80GB SXM	144.2	283.4	418.9	550.7	799.4	1056.3
Compared to Similar Vendor	101%	103%	105%	106%	108%	110%
Compared to 1 GPU (times faster)		1.97	2.91	3.82	5.54	7.33

FPT K8S H100 80GB SXM	143.8	282.4	417.0	546.7	792.8	1046.5
Compared to Similar Vendor	101%	103%	104%	105%	107%	109%
Compared to 1 GPU (times faster)		1.96	2.90	3.80	5.51	7.28

DGX H100 80GB SXM	143.8	282.2	417.2	547.7	793.4	1047.0
Compared to Similar Vendor	101%	103%	104%	105%	107%	109%
Compared to 1 GPU (times faster)		1.96	2.90	3.81	5.52	7.28

FPT VM H100 80GB SXM (no nvlink)	143.0	261.7	376.6	459.5
Compared to Similar Vendor	101%	95%	94%	88%
Compared to 1 GPU (times faster)		1.83	2.63	3.21
Compared to Metal Cloud	99%	92%	90%	83%

H200の結果

（1秒あたりのサンプル数）：FPTのMetal Cloud、バッチサイズ54、95、110

Model	1 GPU	2 GPUs	3 GPUs	4 GPUs	6 GPUs	8 GPUs
Metal Cloud – Bare Metal H200 141GB SXM (bz54)	158.8	312.4	460.7	600.9	881.4	1165.1
Compared to Similar Vendor’s H100	112%	114%	115%	115%	119%	121%
Compared to Metal Cloud H100	110%	110%	110%	109%	110%	110%
Compared to Similar Vendor’s Baremetal H200	101%	101%	102%	101%	104%	105%
Compared to 1 GPU (times faster)		1.84	2.71	3.53	5.18	6.85

Metal Cloud – Bare Metal H200 141GB SXM (bz95)	169.4	332.9	489.2	649.7	917.4	1238.1
Compared to Similar Vendor’s H100	119%	121%	122%	125%	124%	129%
Compared to Metal Cloud H100	117%	117%	117%	118%	115%	117%
Compared to Similar Vendor’s Baremetal H200	107%	108%	108%	110%	108%	112%
Compared to 1 GPU (times faster)		1.96	2.87	3.82	5.39	7.28

Metal Cloud – Bare Metal H200 141GB SXM (bz110)	173.9	341.4	505.8	651.0	973.7	1190.0
Compared to Similar Vendor’s H100	122%	124%	126%	125%	132%	124%
Compared to Metal Cloud H100	121%	120%	121%	118%	122%	113%
Compared to Similar Vendor’s Baremetal H200	110%	111%	112%	110%	115%	107%
Compared to 1 GPU (times faster)		2.01	2.97	3.83	5.72	6.99

FPT AI Factoryは、先進的なインフラとソフトウェア最適化により、GPU性能を最大化しています。

Metal Cloudは、全てのGPU構成で最高の性能を発揮し、他社のベンチマークを上回っています。特にGPU数が増えるほど性能差が拡大し、8GPUでは最大110%の差が見られます。

全てのモデルにおいて、GPU数が増えるほど性能の伸びは鈍化します（サブリニア）。ただし、Metal Cloudは8GPUで7.33倍のスケーリングと最も高い拡張性を示しました。一方、HGX H200は大容量VRAM（141GB対80GB）と高いメモリ帯域幅（4.8TB/s対3.35TB/s）により、より大きなバッチサイズを扱え、最大バッチサイズではH100より最大18%高い性能を実現しました。

FPT AI Factoryのサービス詳細はこちらをご覧ください。

FPT AI Factoryに関するご相談・お問い合わせ：

ホットライン：0800-300-9739
メール：support@fptcloud.jp