推荐配置
昇腾AI计算解决方案,业界最佳AI推理算力,推理成本下降30%。 查看全部配置价格>
AI推理加速型Ai1s
-提供高性能AI推理算力、均衡的CPU内存配比、高性能网络能力。单实例最大可提供上百TOPS的计算性能,能够快速的基于复杂模型完成预测 适用场景:内容检测,视频转码,智慧零售等视觉累类应用
-CPU内存比:1:2/1:4,vCPU范围:2~32
-Ascend310数量:1~16,基频/睿频:2.6GHz/3.4GHz
-AI训练加速型Physical.KAt1
-高性能,支持Alill练和AI重载应用推理AI训练:如BERT,以及视觉类的AI模型训练,Al重载推理,如Al超分辨率
-CPU核数:192,CPU主频:2.6GHz
-内存:768GB,卡间互联带宽:100Gbps
产品优势
专门为AI业务提供加速服务的云服务器,搭载昇腾系列芯片及软件栈
支持Tensorflow,Caffe,Mindspore框架
高性能智能网卡,最大带宽25Gbps,网络时延显著降低
支持Python接口,支持MindStudio图形接口
支持大规模训练、推理集群,训练集群支持8*100Gbps RDMA 网络
多种云主机支持AI训练和AI推理业务
音视频,电商,社交领域中的图片分类,内容检测,画质增强;智慧城市,智慧零售,智慧园区,泛金融认证等
昇腾AI资源
极云专属顾问,快速了解昇腾AI云服务器
应用场景
开箱即用,尤其适合金融、设计、大模型开发以及教育和医疗等行业客户
-
通用大模型开发
完善的网络、存储配套服务;快速交付算力,灵活计费;稳定可持续供应;快速开通、弹性伸缩
场景诉求算力持续供应需要大规模算力构建方案;持续进行大模型适配和优化数据稳定存储输出需要分布式加速库;需要不断试错进行模型优化 -
AIGC创作领域
互联网、媒资等通 过SD模型进行图 片制作、宣传营销
场景诉求业务量的不确定性业务量随社会热 点快速变化易用性极致弹性和性价比;完善的监控服务 和开发工具 -
自动驾驶训练
自动驾驶领域对AI算力的需求主要体现在实时感知和决策、高精度地图构建和更新、复杂环境下的规划与控制、深度学习模型的训练与优化以及安全性和可靠性的保障等方面。
场景诉求业务复杂全栈国产AI服务, 安全合规;存量业务云原生, 数据交互业务量较 大数据处理便捷的数据清洗和 标注服务 -
数字人
数字人厂商内容生 产厂商,进行数字人推理。
场景诉求时延推理时延要求高国产化国产化算力需求;涉及适配模型多