纵观资讯 纵观资讯

当前位置: 首页 » 实时追踪 »

阿里推出全新推理模型 仅1/21参数媲美DeepSeek R1

转自:财联社

【阿里推出全新推理模型 仅1/21参数媲美DeepSeek R1】财联社3月6日电,阿里Qwen团队正式发布他们最新的研究成果——QwQ-32B大语言模型,这是一款拥有 320 亿参数的模型,其性能可与具备 6710 亿参数(其中 370 亿被激活)的 DeepSeek-R1 媲美。QwQ-32B在仅有DeepSeek-R1约1/21参数量的情况下,用强化学习实现了性能上的跨越。

未经允许不得转载: 纵观资讯 » 阿里推出全新推理模型 仅1/21参数媲美DeepSeek R1