推荐配置

昇腾AI计算解决方案,业界最佳AI推理算力,推理成本下降30%。 查看全部配置价格>

AI推理加速型Ai1s

-提供高性能AI推理算力、均衡的CPU内存配比、高性能网络能力。单实例最大可提供上百TOPS的计算性能,能够快速的基于复杂模型完成预测 适用场景:内容检测,视频转码,智慧零售等视觉累类应用

-CPU内存比:1:2/1:4,vCPU范围:2~32

-Ascend310数量:1~16,基频/睿频:2.6GHz/3.4GHz

-AI训练加速型Physical.KAt1

-高性能,支持Alill练和AI重载应用推理AI训练:如BERT,以及视觉类的AI模型训练,Al重载推理,如Al超分辨率

-CPU核数:192,CPU主频:2.6GHz

-内存:768GB,卡间互联带宽:100Gbps

产品优势

专门为AI业务提供加速服务的云服务器,搭载昇腾系列芯片及软件栈

生态兼容
生态兼容

支持Tensorflow,Caffe,Mindspore框架

网络加速
网络加速

高性能智能网卡,最大带宽25Gbps,网络时延显著降低

简单易用
简单易用

支持Python接口,支持MindStudio图形接口

高性能
高性能

支持大规模训练、推理集群,训练集群支持8*100Gbps RDMA 网络

规格丰富
规格丰富

多种云主机支持AI训练和AI推理业务

应用广泛
应用广泛

音视频,电商,社交领域中的图片分类,内容检测,画质增强;智慧城市,智慧零售,智慧园区,泛金融认证等

昇腾AI资源

资源类型
Regoin
按需(元/小时)
包月价(元/月/台)
1xD310P
2xD310P
4xD310P
6xD310P
北京四、上海一
8xD910B-*00/*76t(主推)
1xD910B-400/376t
8×D910B-*80t(主推)
1xD910B-280t
贵阳一
8×D910B-*13t(主推)
1×D910B-313t
乌兰
8xV100
北京四
8xV100
上海一
8xV100
广州一
8xV100
国际站
一对一咨询
极云专属顾问,快速了解昇腾AI云服务器

应用场景

开箱即用,尤其适合金融、设计、大模型开发以及教育和医疗等行业客户

LLM大语言模型
AIGC领域
自动驾驶训练
数字人内容训练
  • LLM大语言模型

    通用大模型开发

    完善的网络、存储配套服务;快速交付算力,灵活计费;稳定可持续供应;快速开通、弹性伸缩

    场景诉求
    算力持续供应
    需要大规模算力构建方案;持续进行大模型适配和优化
    数据稳定存储输出
    需要分布式加速库;需要不断试错进行模型优化
  • AIGC创作领域

    AIGC创作领域

    互联网、媒资等通 过SD模型进行图 片制作、宣传营销

    场景诉求
    业务量的不确定性
    业务量随社会热 点快速变化
    易用性
    极致弹性和性价比;完善的监控服务 和开发工具
  • 自动驾驶训练

    自动驾驶训练

    自动驾驶领域对AI算力的需求主要体现在实时感知和决策、高精度地图构建和更新、复杂环境下的规划与控制、深度学习模型的训练与优化以及安全性和可靠性的保障等方面。

    场景诉求
    业务复杂
    全栈国产AI服务, 安全合规;存量业务云原生, 数据交互业务量较 大
    数据处理
    便捷的数据清洗和 标注服务
  • 数字人内容训练

    数字人

    数字人厂商内容生 产厂商,进行数字人推理。

    场景诉求
    时延
    推理时延要求高
    国产化
    国产化算力需求;涉及适配模型多

相关文档