纵观资讯 纵观资讯

当前位置: 首页 » 实时追踪 »

阿里QwQ-32B“横空出世”,“性能比肩DeepSeek-R1”

QwQ-32B的成功表明,将强大的基础模型与大规模强化学习相结合,能够在较小的参数规模下实现卓越性能,这为未来通向通用人工智能提供了可行路径。

阿里通义发布最新开源推理模型,称其性能比肩DeepSeek-R1

01

阿里发布最新开源推理模型

中国大模型领域同时发生了两个上热搜的AI话题:一边是AI Agent产品Manus,另一边则是阿里巴巴全新开源的通义千问QwQ-32B模型。

前者引发的讨论中,不少人把它称为DeepSeek级别的“炸裂”成果,并称“硅谷因它一夜无眠”。不过有趣的是,在国际AI社区中,真正引起广泛讨论的其实是后者。

3月6日凌晨,阿里正式发布模型后,QwQ-32B当天即登顶HuggingFace的开源模型榜单。

阿里称,这是一款拥有320亿参数的模型,其性能可与具备6710亿参数(其中370亿被激活)的DeepSeek-R1媲美,但二者在参数量上相差将近20倍。

通过大规模强化学习,QwQ-32B在数学、代码及通用能力上实现质的飞跃,整体性能比肩DeepSeek-R1,同时大幅降低了部署使用成本,在消费级显卡上也能实现本地部署。

值得注意的是,尽管DeepSeek-R1拥有6710亿的巨型参数量,但由于DeepSeek创新性地使用了MoE(混合专家模型)架构以及MLA(多头潜在注意力机制)的方法,每次推理仅激活370亿参数(占总量的5.5%)。这使得DeepSeek-R1虽然整体很大,但实际干活时只需要动用一小部分力量,能够做到节省资源,高效完成任务。

在数学推理、编程能力和通用能力的一系列基准测试中,通义千问大模型团队将QwQ-32B与OpenAI的o1-mini以及DeepSeek满血版及蒸馏版进行了比较,结果显示,在测试数学能力的AIME24评测集上,以及评估代码能力的LiveCodeBench中,QwQ-32B表现与DeepSeek-R1相当,远胜于o1-mini及相同尺寸的R1蒸馏模型。

业内人士分析,QwQ-32B的成功表明,将强大的基础模型与大规模强化学习相结合,能够在较小的参数规模下实现卓越性能,这为未来通向通用人工智能提供了可行路径。

此外,QwQ-32B的另外一个亮点是大幅降低了部署使用成本,开发者和企业可以在消费级硬件上轻松将其部署到本地设备中。

QwQ-32B采用了Apache 2.0开源协议,目前,所有人都可免费下载及商用QwQ-32B模型,或通过网页版Qwen Chat进行体验,该模型也将免费上架通义APP。

以AI驱动云的生长,是阿里云选择开源之路的根本原因。2023年8月开始,阿里云通义千问相继开源Qwen、Qwen1.5、Qwen2、Qwen2.5等4代模型,从而迅速建立起庞大的“Qwen模型家族”。

阿里云CTO周靖人指出,“阿里云的初衷不是把模型攥在自己手里,或者做商业化,而是帮助开发者。”大模型的开发成本迄今为止仍然极为昂贵,但开源让大企业和中小企业都能快速、廉价地接入大模型,意味着技术的普惠和平权。

02

阿里“C计划”

AI To C,已经成为阿里的关键战略。

据了解,阿里AI To C是该公司围绕面向消费者的人工智能业务所构建的一个业务体系,涵盖多个产品和团队,包括协同办公工具钉钉、OTA平台飞猪、外卖平台饿了么、视频APP优酷等等,但都表现并不出色。

如今,阿里再次调集资源鏖战C端。2024年11月底,吴泳铭“点将”,淘宝用户事业部和阿里妈妈前负责人吴嘉,回归智能信息事业群担任总裁,专注AI To C业务的探索。同年12月中旬,业务整合开启。

随后,阿里旗下AI应用“通义”并入阿里智能信息事业群,天猫精灵团队与夸克产品团队融合,探索AI眼镜等新硬件方向。

全球顶尖人工智能科学家、Salesforce集团前副总裁许主洪出任阿里集团副总裁,负责AI To C业务的多模态基础模型及Agents相关基础研究与应用解决方案。

与此同时,AI To C的战略雏形在阿里频繁的动作中得以显现。最近开放的数百个招聘岗位中,AI产品和技术研发岗位占比达到90%,将集中投入文本、多模态大模型、AI Agent等研发方向。

此前,阿里最重要的AI To C阵地夸克,已经明确了全新的品牌Slogan“2亿人的AI全能助手”,亮出加速探索AI to C应用的全新业务态势。

目前,阿里巴巴已经把夸克明确为代表性AI to C应用之一。夸克是在AI搜索领域中国用户量最高的应用,据七麦统计,2024年,夸克累计下载量超过3.7亿,高居国内第一。同时它也是目前国内唯一一款00后年轻用户数量占比超过50%的AI应用。

今年,夸克内部预计会把用户增长与留存维度、AI功能渗透率维度,继续作为重要指标。

据阿里内部人士说法,夸克与通义将成为阿里面向C端用户的AI“左右手”。

在AI产品的C端市场,用户量等指标将被视为关键维度,这说明,阿里对于自己在“AI to C”市场的用户量级和整体声量有强烈渴望与要求。

03

AI推动云业务重回两位数增长

在通义千问最新推理模型发布并开源后,阿里巴巴股价应声大涨。隔夜美股收盘涨8.61%,报收141.03美元。今年以来,阿里巴巴股价累计涨幅已近70%。

2024年四季度,阿里巴巴营收同比增长8%至2801.54亿元,归母净利润同比上升239.12%至489.45亿元。全年,阿里巴巴营收9817.67亿元,归母净利润2203亿元。

阿里云作为战略转型的核心载体,2024年实现营收317.42亿元,同比增长13%,营收占比升为11.33%。该增长得益于AI相关产品推动的公共云收入增长,AI收入已连续六个季度三位数增长。

财报显示,阿里云对外商业化收入同比增长11%,增长主要得益于公共云收入的两位数增长,其中AI相关产品的收入连续第六个季度保持了三位数的同比增长。同时,阿里云在近几个季度保持盈利,经调整后EBITA利润率约为10%左右。

该季度内,阿里云调整后EBITA增长33%至31.38亿元,这一增长主要得益于产品结构向高利润率公共云产品的转变以及运营效率的提升,部分抵消了在客户增长和技术方面的投资增加。

来源 | 《商学院》杂志综合自澎湃新闻、上海证券报、国际金融报、每日经济新闻、证券时报、界面新闻、科创板日报、IT时报

编辑 | 吴蒙

未经允许不得转载: 纵观资讯 » 阿里QwQ-32B“横空出世”,“性能比肩DeepSeek-R1”