L20和H20在计算资源上有什么不同?
发布日期:
2025-04-08 13:39:44
本文链接
https://www.idcsp.com//help/2549.html
本文关键词
以下是 NVIDIA L20 和 H20 在计算资源上的详细对比:
参数 L20 H20
GPU架构 NVIDIA Ada Lovelace NVIDIA Hopper
内存类型 GDDR6(带ECC) HBM3
内存容量 48 GB 96 GB
内存带宽 864 GB/s 4.0 TB/s
INT8/FP8算力 239 TFLOPS 296 TFLOPS
BF16/FP16算力 119.5 TFLOPS 148 TFLOPS
TF32算力 59.8 TFLOPS 74 TFLOPS
FP32算力 59.8 TFLOPS 44 TFLOPS
NVLink支持 不支持 支持(900 GB/s)
MIG功能 未知 最多7个实例
L2缓存 96 MB 60 MB
热设计功耗(TDP) 275 W 400 W
外形规格 2槽FHFL(PCIe Gen4 x16) 8路HGX(SXM接口)
适用场景 工作站、服务器推理 大模型推理、多卡协同
关键差异说明
架构与内存:
H20 基于 Hopper 架构,配备更高带宽的 HBM3 内存,适合对显存带宽敏感的推理任务(如大模型 Decode 阶段)。
L20 基于 Ada Lovelace 架构,内存类型为 GDDR6,容量和带宽均低于 H20。
计算能力:
H20 的 INT8/FP8 算力(296 TFLOPS)高于 L20(239 TFLOPS),但 L20 的 FP32 算力略优(59.8 TFLOPS vs 44 TFLOPS)。
互联与扩展性:
H20 支持 NVLink 高速互联,可通过多卡堆叠提升性能。
L20 仅支持 PCIe 接口,扩展性受限。
功耗与定位:
H20 功耗更高(400W),主打高并发推理场景。
L20 功耗较低(275W),适合对成本和空间敏感的工作站环境。
总结
H20 适合高并发推理场景,特别是大模型的 Decode 阶段,其高带宽显存和 NVLink 支持使其在多卡协同任务中表现出色。
L20 更适合对成本和空间敏感的工作站环境,其较低的功耗和较高的 FP32 算力使其在一些推理任务中具有较高的性价比。
成都算力租赁入口:https://www.idcsp.com/gpu/
成都算力租赁官方电话:400-028-0032
优选机房