首页财经理财产业商业证券消费图片视频全国

话题

新浪微博图片视频手机站

旗下栏目：国际国内话题热评

> 财经 > 话题 >

阿里千问登顶空间推理全球榜首，超越Gemini 3与GPT-5.1

来源：作者：P粉602998670 人气：发布时间：2025-11-26

摘要：近日，在衡量多模态模型空间推理能力的关键基准测试SpatialBench的最新榜单中，来自阿里巴巴的视觉理解模型取得了瞩目的成绩。其旗下的千问Qwen3-VL和Qwen2.5-VL模型，成功包揽了榜单的前两名，其表现超越了包括谷歌Gemini 3、OpenAI GPT-5.1以及Claude Sonne

近日，在衡量多模态模型空间推理能力的关键基准测试spatialbench的最新榜单中，来自阿里巴巴的视觉理解模型取得了瞩目的成绩。其旗下的千问qwen3-vl和qwen2.5-vl模型，成功包揽了榜单的前两名，其表现超越了包括谷歌gemini 3、openai gpt-5.1以及claude sonnet 4.5在内的所有国际顶尖模型。

具体的榜单数据显示，千问Qwen3-VL-235B和Qwen2.5-VL-72B的得分分别为13.5分和12.9分，而作为对比，Gemini 3.0 Pro的得分为9.6分，GPT-5.1为7.5分。不过，榜单也指出，目前所有AI大模型的整体表现，距离能够专业处理复杂空间推理任务的人类基准线（约80分）仍有较大差距。

据了解，作为阿里在2025年最新开源的新一代视觉理解模型，Qwen3-VL在视觉感知和多模态推理方面实现了重大突破。它不仅可以调用抠图、搜索等外部工具，来完成复杂的“带图推理”任务，甚至可以仅凭借一张设计草图或一段游戏视频，直接进行“视觉编程”。

Caktus AI

Caktus AI 是一个专为学生和教师打造的教育工具，可以帮助论文写作、数学问题、编程助手、语言学习等等！

下载

同时，Qwen3-VL还专门增强了其3D检测能力，能够更好地感知空间关系，这使得机器人在判断物体方位、视角变化等方面，能够实现更精准的操作。目前，Qwen3-VL已开源了从2B到235B MoE等多个不同参数规模的版本，并已上线至千问App，供所有用户免费体验。

SpatialBench作为近年来新兴的第三方基准测试，其主要聚焦于多模态模型在空间、结构、路径等方面的综合推理能力，被AI社区视为是衡量“具身智能”发展水平的新兴标准之一。

责任编辑：P粉602998670

上一篇：星闪音频，开启“真无损”非凡音质

下一篇：没有了

频道精选

中国150家企业入选！2025全球独角兽500强榜单发布2026-01-15 16:44:29
多家外资银行发布2026年经济展望普遍看好中国经济前2026-01-13 17:09:18
2026 年元旦大盘票房 3.29 亿，《疯狂动物城 2》获冠2026-01-03 00:00:00
平安车险购买全流程指南2026-01-01 22:10:00
陶冬：美联储新主席势必有大动作2025-12-08 11:56:00

平安车辆保险费计算器的两大特点，为车友们带去很多意2026-02-03 21:56:02
中国150家企业入选！2025全球独角兽500强榜单发布2026-01-15 16:44:29
平安车险购买全流程指南2026-01-02 22:14:00
平安车险购买全流程指南2026-01-01 22:10:00
平安车险购买全流程指南2026-01-01 16:34:00

平安车辆保险费计算器的两大特点，为车友们带去很多意

平安车辆保险费计算器的两大特点，为车友们带去很多意

中国150家企业入选！2025全球独角兽500强榜单发布

中国150家企业入选！2025全球独角兽500强榜单发布

2026年车险公司推荐选哪家？首选平安财

2026年车险公司推荐选哪家？首选平安财...
浏览次数：19257次

中国150家企业入选！2025全球独角兽500强榜单发

浏览:1653次

陶冬：美联储新主席势必有大动作

浏览:765次

多家外资银行发布2026年经济展望普遍看好中国经

浏览:654次

打造“青创第一城”，浦东全方位降低青年创新创

浏览:512次

“央行中的央行”警告：黄金与股市走势趋同，可

浏览:507次

年内最后一个超级央行周！美联储或降息、重启购

浏览:499次

安徽省商务厅厅长曹勇：合芜马自贸区力争上半年

浏览:477次

首批氢能区域试点披露增长目标，万亿氢能大市场

浏览:475次

赵建：至少有四个时代红利不能辜负

浏览:464次

最火资讯

平安车辆保险费计算器的两大特点，为车
购买渠道与操作流程官方APP/小程序操作路径 1. 下载与登录平安好车主APP...
前11个月我国服务业发展持续向好
今年前11个月，我国服务业发展持续向好，服务消费潜力持续释放，对经济增长...
中国150家企业入选！2025全球独角兽500
统计数据显示，2025年全球独角兽企业500强总估值达39.14万亿元，同比增长超...
·一财社论：整治代理维权陷阱，关键是让
·一财首席经济学家调研：新年良好开局，
·AI红包大战：“智能中枢”争夺的早期预
·科创与金融双向赋能，推动上海“五个中
·陶冬：Claude Cowork引爆AI应用革命
·提振居民消费：从政策驱动到内生动力的
·管涛：沃什重返美联储影响几何
·梅新育：经济民生危机动摇伊朗基础

首页 | 财经 | 理财 | 产业 | 商业 | 证券 | 消费 | 图片 | 视频 | 全国

Copyright 2025 九掌金融版权所有技术支持：政产学研(海南）投资有限公司备案号：琼ICP备2025065810号-1

电脑版 | 移动版