ベンチマークは、AIや機械学習におけるGPU性能を評価する上で非常に重要です。
本調査では、さまざまなGPUタイプでのトレーニング速度やスケーラビリティ(拡張性)を測定し、利用者が自分の用途に最適なGPUを選べるようサポートします。
社内評価だけでなく、FPT GPU Cloudの性能を同等の他社サービスと比較し、処理能力・メモリ帯域幅・スケーラビリティなどの主要な強みを明らかにしています。これにより、ユーザーはAI業務に最も効率的なGPUクラウドサービスを選択できます。
FPT AI FactoryのOptimum Habanaトレーナーコードのフォーク版もご覧ください。H100ベンチマークは、そのリポジトリの手順に従うことで再現可能です。
以下のベンチマークは、HabanaのOptimum Habana v1.7トレーナーコードを使い、NVIDIA HGX H100およびHGX H200の性能を他社サービスと比較評価しています。
H100の結果
(1秒あたりのサンプル数):FPTのMetal Cloud、K8S、DGX、VM(バッチサイズ54)
| Model | 1 GPU | 2 GPUs | 3 GPUs | 4 GPUs | 6 GPUs | 8 GPUs |
| Similar Vendor’s H100 80GB SXM | 142.3 | 275 | 400.6 | 521.8 | 740.3 | 962.2 |
| Compared to 1 GPU (times faster) | 1.93 | 2.82 | 3.67 | 5.20 | 6.76 | |
| Metal Cloud – Bare Metal H100 80GB SXM | 144.2 | 283.4 | 418.9 | 550.7 | 799.4 | 1056.3 |
| Compared to Similar Vendor | 101% | 103% | 105% | 106% | 108% | 110% |
| Compared to 1 GPU (times faster) | 1.97 | 2.91 | 3.82 | 5.54 | 7.33 | |
| FPT K8S H100 80GB SXM | 143.8 | 282.4 | 417.0 | 546.7 | 792.8 | 1046.5 |
| Compared to Similar Vendor | 101% | 103% | 104% | 105% | 107% | 109% |
| Compared to 1 GPU (times faster) | 1.96 | 2.90 | 3.80 | 5.51 | 7.28 | |
| DGX H100 80GB SXM | 143.8 | 282.2 | 417.2 | 547.7 | 793.4 | 1047.0 |
| Compared to Similar Vendor | 101% | 103% | 104% | 105% | 107% | 109% |
| Compared to 1 GPU (times faster) | 1.96 | 2.90 | 3.81 | 5.52 | 7.28 | |
| FPT VM H100 80GB SXM (no nvlink) | 143.0 | 261.7 | 376.6 | 459.5 | ||
| Compared to Similar Vendor | 101% | 95% | 94% | 88% | ||
| Compared to 1 GPU (times faster) | 1.83 | 2.63 | 3.21 | |||
| Compared to Metal Cloud | 99% | 92% | 90% | 83% |
H200の結果
(1秒あたりのサンプル数):FPTのMetal Cloud、バッチサイズ54、95、110
| Model | 1 GPU | 2 GPUs | 3 GPUs | 4 GPUs | 6 GPUs | 8 GPUs |
| Metal Cloud – Bare Metal H200 141GB SXM (bz54) | 158.8 | 312.4 | 460.7 | 600.9 | 881.4 | 1165.1 |
| Compared to Similar Vendor’s H100 | 112% | 114% | 115% | 115% | 119% | 121% |
| Compared to Metal Cloud H100 | 110% | 110% | 110% | 109% | 110% | 110% |
| Compared to Similar Vendor’s Baremetal H200 | 101% | 101% | 102% | 101% | 104% | 105% |
| Compared to 1 GPU (times faster) | 1.84 | 2.71 | 3.53 | 5.18 | 6.85 | |
| Metal Cloud – Bare Metal H200 141GB SXM (bz95) | 169.4 | 332.9 | 489.2 | 649.7 | 917.4 | 1238.1 |
| Compared to Similar Vendor’s H100 | 119% | 121% | 122% | 125% | 124% | 129% |
| Compared to Metal Cloud H100 | 117% | 117% | 117% | 118% | 115% | 117% |
| Compared to Similar Vendor’s Baremetal H200 | 107% | 108% | 108% | 110% | 108% | 112% |
| Compared to 1 GPU (times faster) | 1.96 | 2.87 | 3.82 | 5.39 | 7.28 | |
| Metal Cloud – Bare Metal H200 141GB SXM (bz110) | 173.9 | 341.4 | 505.8 | 651.0 | 973.7 | 1190.0 |
| Compared to Similar Vendor’s H100 | 122% | 124% | 126% | 125% | 132% | 124% |
| Compared to Metal Cloud H100 | 121% | 120% | 121% | 118% | 122% | 113% |
| Compared to Similar Vendor’s Baremetal H200 | 110% | 111% | 112% | 110% | 115% | 107% |
| Compared to 1 GPU (times faster) | 2.01 | 2.97 | 3.83 | 5.72 | 6.99 |
FPT AI Factoryは、先進的なインフラとソフトウェア最適化により、GPU性能を最大化しています。
- Metal Cloudは、全てのGPU構成で最高の性能を発揮し、他社のベンチマークを上回っています。特にGPU数が増えるほど性能差が拡大し、8GPUでは最大110%の差が見られます。
- FPT K8Sは、追加のオーバーヘッドがあるため若干性能が下がりますが、それでも十分競争力があります。
- FPT VM(NVLinkなし)は、特に複数GPU環境で性能が低く、NVLinkが拡張効率に与える重要な役割が確認できます。
- 全てのモデルにおいて、GPU数が増えるほど性能の伸びは鈍化します(サブリニア)。ただし、Metal Cloudは8GPUで7.33倍のスケーリングと最も高い拡張性を示しました。一方、HGX H200は大容量VRAM(141GB対80GB)と高いメモリ帯域幅(4.8TB/s対3.35TB/s)により、より大きなバッチサイズを扱え、最大バッチサイズではH100より最大18%高い性能を実現しました。
FPT AI Factoryのサービス詳細はこちらをご覧ください。
FPT AI Factoryに関するご相談・お問い合わせ:
ホットライン:0800-300-9739
メール:support@fptcloud.jp
