能战胜行测图形推理题目吗?阿里推出QVQ
今日凌晨,胜行阿里旗下的测图出通义千问推出了一款视觉推理模型——QVQ-Max,Qwen团队称该模型具备理解图片与视频内容的形推法制与新闻网招聘能力,并且还能根据所提供的理题里推信息展开分析推理。
我们目前所用到的胜行常见大模型虽然也能上传图片,但是测图出只能识别图片里的文字,对画面图形则缺少概念,形推因此不能算作视觉推理模型,理题里推QVQ-Max则着重提升了这一点。胜行
“例如,测图出在一道几何题中,形推它可以根据题目附带的理题里推图形推导出答案;在一段视频里,它能根据画面内容推测出接下来可能发生的胜行法制与新闻网招聘情节。”

不过光看千问团队的测图出宣传好像也感觉不出来到底有多厉害,不如咱们直接来给它上上强度。形推
热点科技这里准备了几道公务员行测的图形推理模拟题,来看看QVQ-Max到底能不能给出正确答案。
首先我们在QWEN CHAT平台选择这一模型,将从网上收集到的题目图片上传,直接询问答案。不过需要注意的是,或许是由于该模型今天才上线,在上传题目图片时总是提示网络错误,稍后再试。大家可能需要耐心点多试几次。
第一题如图,QVQ-Max响应很快,但是想的好像有点多,思考了足足3500个汉字才给出答案D选项,但是回答错误,正确答案是B。



一题好像并不能证明实力,咱们又上传了新的一题,看看QVQ-Max能不能一雪前耻。不过这一题对于QVQ-Max来说好像有点困难,竟然思考了多达6000个汉字才给出答案,仍然是D选项,仍然是错误的,正确答案是B。



最后一次,再来一题。好在这次结果还算好,QVQ-Max给出了正确的答案B选项,但是思考时间实在太长,依然足足有6000个汉字,等待时间接近十分钟,如果QVQ-Max去考试,恐怕没做完题目就要收卷了。


看起来行测的图形推理题目对于QVQ-Max来说有点超纲,本想试着上传一段视频,测测QVQ-Max的视频能力,但是显示一直上传失败,只得作罢。有兴趣的朋友可以自行去测试一下QVQ-Max的其他能力噢。
根据Qwen团队的解释,QVQ-Max目前只是第一版,还有很多提升空间。希望Qwen团队加把劲,让QVQ-Max早日拿捏行测图形推理。
相关阅读
- 2025年近7亿人次出入境——双向奔赴,开放型经济活力足
- 郑钧“私奔”北京场圆满落幕高旗刘芸到场助阵
- 宜城一挖掘机坠河,河水漫过受困司机胸口 警消20分钟破拆车门成功救援
- 乡村振兴的“东亭密码”
- 视频丨马年生肖文化礼品上新 “非遗”产品持续走俏
- 舒淇不洗澡的原因是什么呢?舒淇为什么不洗澡呢?
- 合肥文博会成为城市“新名片”
- 宜城一挖掘机坠河,河水漫过受困司机胸口 警消20分钟破拆车门成功救援
- 实证唐代中央政权有效管辖治理新疆 库车市友谊路墓群考古新发现
- 今起河南连续三天阴雨 气温急转直下
- 10月26日起 郑州903路公交线路将进行优化调整
- 林更新《楚乔传》命运重逢 实力诠释“眼技”在线
- 我国全社会物流成本稳步下降
- 雷佳现身《跨界》 化身“女儿国国王”助力于毅
- 网友“自我确诊”前额叶受损,靠谱吗?
- 熊黛林任世界旅游小姐中国区复赛总决赛评委 7.8日上海总决赛
- 收藏!米兰冬奥今日赛程速览
- 美伊谈判受挫 国际油价显著上涨
- 网友投诉演唱会座椅脏被拉黑 桂林市文旅局通报
- “开盒”网暴、倒卖学历学籍信息等犯罪被惩治,谁在贩卖你的个人信息