搜索
房产
装修
汽车
婚嫁
健康
理财
旅游
美食
跳蚤
二手房
租房
招聘
二手车
教育
茶座
我要买房
买东西
装修家居
交友
职场
生活
网购
亲子
情感
龙城车友
找美食
谈婚论嫁
美女
兴趣
八卦
宠物
手机
打印 上一主题 下一主题

阿里推出全新推理模型:仅1/21参数媲美DeepSeek R1

[复制链接]
查看: 37|回复: 0

19万

主题

19万

帖子

58万

积分

论坛元老

Rank: 8Rank: 8

积分
587921
跳转到指定楼层
楼主
发表于 2025-8-4 09:02 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
3月6日消息,阿里Qwen团队正式发布他们最新的研究成果——QwQ-32B大语言模型。
这是一款拥有320亿参数的模型,其性能可与具备6710亿参数(其中370亿被激活)的DeepSeek-R1媲美。
QwQ-32B在仅有DeepSeek-R1约1/21参数量的情况下,用强化学习实现了性能上的跨越。
此外,阿里还在推理模型中集成了与Agent相关的能力,使其能够在使用工具的同时进行批判性思考,并根据环境反馈调整推理过程。
QwQ-32B 在一系列基准测试中进行了评估,测试了数学推理、编程能力和通用能力。
其中,在测试数学能力的AIME24评测集上,以及评估代码能力的LiveCodeBench中,千问QwQ-32B表现与DeepSeek-R1相当,远胜于o1-mini及相同尺寸的R1 蒸馏模型。
同时,在由meta首席科学家杨立昆领衔的“最难LLMs评测榜”LiveBench、谷歌等提出的指令遵循能力IFeval评测集、由加州大学伯克利分校等提出的评估准确调用函数或工具方面的BFCL测试中,千问QwQ-32B的得分均超越了DeepSeek- R1。
目前,QwQ-32B已在Hugging Face和ModelScope开源,大家也可通过Qwen Chat直接进行体验!(随心)
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Copyright © 2006-2014 oopz大明星网,男女明星图片,明星八卦新闻,明星个人资料大全 版权所有 法律顾问:高律师 客服电话:0791-88289918
技术支持:迪恩网络科技公司  Powered by Discuz! X3.2
快速回复 返回顶部 返回列表