每经记者 张韵 每经编辑 董兴生
DeepSeek上线以来,国产算力资源的采购意愿显著提升。
3月24日,《每日经济新闻》记者在上海电信“算力超市”看到,数据安全敏感型的企业更倾向于选择专属化部署方案。相比传统IDC(互联网数据中心)服务,云端专属算力服务已支持专线接入DeepSeek大模型,进一步解决本地一体机的成本痛点。结合智云网络,政务、教育、医疗等行业企业也可选择边缘云计算方案,保证数据安全。
当算力资源的灵活调度成为新趋势,国产算力芯片的全面普及还面临哪些挑战?记者走访中国电信临港智算谷了解到,AI算力需要消耗大量电力,为降低运营成本,路径包括引入光伏发电、购买绿电、探索虚拟电厂,算力中心会向客户提供柴发、储能、光伏等虚拟机组资源,优化能源利用和成本控制。
图片来源:每经记者 张韵 摄但不可否认的是,这场由技术驱动、政策支持、市场需求共同推动的算力革命,正在悄悄改变国产算力的命运,芯片厂商迎来了从技术适配迈向商业落地的关键阶段。
“刚刚周末退出来两台设备,如果客户想要,可以马上续上。”3月24日,星期一,在中国电信上海分公司的天翼云能力运营中心,不时有企业咨询不同芯片算力卡的服务费用。
放下电话,解决方案中心经理宋蒙向记者表示,在满足性能要求的基础上如何降低成本是客户最大的诉求。今年DeepSeek大模型的问世,不仅加剧了AI算法领域的开源竞争,也推动了国产芯片的适配进程,可以说今年是国产算力发展的机遇期。
自2022年起,从A100、H100到“降级版”A800、H800,美国限制高端AI芯片对华出口背后的底层逻辑是基于AI训练“大力出奇迹”的认知,即认为更大的AI模型、更多算力资源就意味着更智能的AI。然而,这一认知似乎正在被新的算法范式打破。
今年1月,DeepSeek通过Transformer架构优化、混合精度训练、计算并行优化以及分布式存储管理等技术创新,大幅降低AI训练和推理的计算需求。小而美且开源的DeepSeek,不仅让全球反思“堆卡烧钱”的OpenAI路线是否走偏,也为国产算力芯片和云服务商打开通往AGI(通用人工智能)的另一扇窗。
在宋蒙看来,中国AI应用落地受限于两大瓶颈。首先,英伟达构建的CUDA生态护城河,让AI大模型向国产算力芯片的迁移变得困难;其次,在国产大模型百花齐放、国产芯片厂商不断涌现的背景下,多对多的算法和算力适配更是困难重重。
“但DeepSeek很好地解决了第二个问题。”宋蒙告诉记者,它让原本发散的模型侧有了一次收敛,现在华为、沐曦、天数、壁仞、寒武纪、昆仑芯等在内的算力芯片厂商,都与DeepSeek完成了模型适配,“将算子调优,有的可以跑671B满血版,有的能跑蒸馏版,或多或少都能跑起来了”。
此外,三大运营商全面接入DeepSeek后,其GPU利用率及IDC上架率也有所提升。电信天翼云自主研发的“息壤”智算平台,也在今年2月完成了国产算力芯片与DeepSeek-R1/V3系列大模型的深度适配优化。
3月24日,《每日经济新闻》记者走进上海电信“算力超市”,运维人员正在电脑前监控着算力调度的实时数据。宋蒙介绍,DeepSeek改变了国产算力的命运,企业本地化部署需求进一步跃升。
图片来源:每经记者 张韵 摄谈及DeepSeek带来的业务变化,3月25日,中国电信董事长兼首席执行官柯瑞文在2024年度业绩说明会上表示,息壤DeepSeek一体机推出后签约额已达6亿元,从内部资源使用来看,自有算力售卖率已超过90%,相比DeepSeek上线前翻倍。
此外,中国电信天翼云官网访问量也在两周内增加了5.7万人次,为DeepSeek上线前的16至17倍。与此同时,模型服务和token调用量都呈现出了指数级的增长。
火爆的需求背后是企业对部署方式的多样化选择。宋蒙告诉记者,企业使用DeepSeek目前有四种模式,最先是公有云SaaS(软件即服务)部署,这种方式便捷、价低但数据存储在云端,使用API(应用程序编程接口)接口的应用级对接,也存在一定的隐私和安全风险。
为了避免数据泄露,一些企业开始采取本地化部署。“他们会在自己的机房单独购买GPU服务器,将开源大模型DeepSeek装在服务器上,连到企业自己的内网就可以使用了。这种方式保证了数据安全,但最大的问题就是太贵了。”宋蒙坦言。
记者也在走访中发现,金融类企业通常会采用自建机房的方式进行算力的本地化部署,但需要一次性支付百万元的三年结算价及后期一定比例的维保费用,才能以租赁的形式长期使用机柜服务,这对于只想短期部署或是对价格敏感的企业而言,无疑是一个负担。
宋蒙告诉记者,市场之所以如此定价是为了拉平硬件投资回报,避免回款风险。目前,部署一套DeepSeek满血版软硬件的价格非常高昂,订购GPU服务器后,还需要做硬件的集成、机房的改造、专线的部署等。
于是,为满足数据安全、成本节约的需求,“公共算力服务平台”应运而生。上海电信将其形象地称为“算力超市”,企业可以通过产品订购,享受到运营商级的机房环境、独立的硬件资源以及专属的DeepSeek模型。
为了进一步降低用户的使用门槛,《每日经济新闻》记者了解到,向市场推出云端专属算力服务,用1%的月租成本撬动同性能算力供应⋯⋯电信运营商正不断探索降低成本的销售模式。
那么,相比于传统的IDC服务,公共算力服务在商业模式上有怎样的范式创新?
“在模型收费的时代,企业用户一般会向模型厂商自行采购软件,由模型供应商负责安装部署。现在,开源模型本身是免费的,算力超市可以提供安装部署服务。对企业而言,把模型下载下来,安装到服务器上,并能正常跑起来,也是一个技术活。”宋蒙打了一个比方,如果把传统IDC机柜服务看作是一套“毛坯房”,那么算力超市就是“精装修”,热门模型与算力芯片都已打包,企业可以实现“拎包入住”。
而面对中小企业的“临时性算力需求”,更低的成本、更简化的模型需求催生了更为灵活的解决方案。上海电信进一步将一台物理服务器切成了单卡与多卡,以小时计费,企业只要支付3元/卡时的价格,就可以进行AI的开发调测及训练推理,这有效提升了公共算力服务的普惠性。
业界对模型算力的认知也在快速迭代。近日,蚂蚁集团Ling团队发表论文称,实验表明,MoE(混合专家)大模型可在国产芯片上训练出与英伟达H800芯片相当的效果,且训练成本降低20%。
中国正在经历一场低调的算力革命,这无疑点燃了“去英伟达化”的希望。从华为910B撑起千亿参数模型训练,到DeepSeek带动国产芯片厂商完成软硬件协同适配,国产算力正试图通过算法创新与硬件迭代实现弯道超车。
随着国产芯片借势崛起,未来,普惠型“算力超市”又该如何保证优质算力资源上架,降低硬件迭代的采购风险?3月24日,《每日经济新闻》记者进一步走访中国电信临港智算中心园区寻求答案。
来到园区,一栋栋5层高的数据机楼正在加紧建设。记者看到,1.1期项目已全面投产,两路市电经220KV变电站向智算集群输送稳定电力,并配备一栋柴发机楼应对突发事件的用电需求。
走进临港智算谷,现场物业部经理向记者介绍,1.2期的主体结构已经基本建造完毕,正在进行二次结构及内部装修施工,整个项目一期工程占地119亩,将于12月份正式投入使用。二期项目计划分四批开发,计划2026—2029每年交付两栋机楼。
“随着DeepSeek的火爆出圈,我们针对本地化部署需求推出了标准化、模块化、定制化的算力基础服务。”临港算力项目部项目经理时云松告诉记者,面对算力行业迅速发展和需求多样化趋势,客户对交付周期提出了更高的要求,临港智算谷的建设难点在于如何快速且有效满足客户需求。
目前,已有企业对建设中的数据机楼订购了包楼服务。对此,项目部需要在园区建设上进行超前考量,结合客户对机楼层高以及实际荷载要求,以“两弹一优”的高标准提高供电、散热、制冷、承重等基础设施能力,从而实现快速响应和定制化的基础服务。
行至数据机楼3层,记者跟随时云松步入冷板式液冷核心机房,耳边传来背板风冷设备高速运转的呼呼声,走进液冷DC舱内,体感温度相比机房室温明显下降。时云松告诉记者,国产万卡池使用了3∶7的风冷液冷配比达到供冷最优,使PUE(评价数据中心能源效率的指标)保持在低于1.25的水平。另外,规模化智算机架还规划配备了32台浸没式液冷设备。
时云松称,临港智算中心的国产万卡算力池,使用的算力卡主要集中在华为910B,另有壁仞、沐曦等国产算力卡也已基本完成性能测试,目前应用于国产混训项目中。
图片来源:每经记者 张韵 摄宋蒙补充道,目前,国产算力厂商不断推出新型GPU芯片,如果能够以更低的成本给客户使用,公司也愿意引入此类产品,但需经过国产GPU创新联合基地的测评,只有性能符合要求、价格为市场所接受的算力资源才会最终上架。
“长久运营好算力超市,要做好质量与服务两件事。”在谈及未来的长期规划时,宋蒙认为,向客户提供高质量的算力服务,不仅体现在拥有琳琅满目的算力产品,还要提供满足客户需求的使用服务,围绕客户的真实使用场景,推出模型调优、AI应用等进阶服务。
宋蒙观察发现,如今越来越多的客户不仅需要算力和模型,更想要能直接上手的AI应用。中国电信正准备上架一系列AI应用,涉及专属智能问答、AI企业法务、智能公文写作等细分领域。