您当前所在位置: 主页 > 信息平台 > 经贸信息

高考期间AI大模型图片识别问答功能暂停,小雷却有质疑

发布时间:2025-06-11 12:03|栏目: 经贸信息 |浏览次数:

高考本就是人生至关重要的大考,其公平性不容有任何侵犯。而现如今AI盛行,为防患于未然,一些企业暂停了AI大模型的图片识别问答功能,这到底是过度防备,还是确有必要?且听我慢慢道来。

AI服务暂停之议

数学考满分的牲口__数学高考模型与技巧

今年高考期间,腾讯混元、通义千问、Kimi、豆包这些国内很有名的AI大模型,它们的图片识别问答功能都给暂停。就有个叫小雷的人对此存疑他前面测试AI大模型做高考题,很多表现都不太好哩,觉得暂停这功能是不是太看得起它们的能力。企业这么做真的是多此一举?这就引发了大家不少的思考。

数学测试之选

_数学考满分的牲口_数学高考模型与技巧

小雷寻思着要慎重点儿弄清楚这事,就选了有标准答案的数学科目来测试AI大模型。他挑了DeepSeek、豆包、讯飞星火、文心一言、Kimi、通义千问这些模型。就想看看它们能不能有考上985、211的水平。为啥选数学科目,就是因为它答案明确数学没那么多含糊的部分。

首题表现之佳

拿出的第一道题难度不算高,算是个开胃小菜。那参与测试的六款AI大模型倒蛮争气的,全部把正确答案算出来而且还给出了详细的推理过程。这次测试里所有的AI大模型都拿到了5分的满分。看来这些大模型对于基础一些的题还是能轻松拿下的!

_数学考满分的牲口_数学高考模型与技巧

难题考验之忧

有一道超难的题出来就不一样。只有豆包在两分钟内算出正确答案,讯飞星火和通义千问用时多那么一点儿。其他模型用时就长多,特别是DeepSeek,花了足足572秒,快10分钟。要是AI按考生那样一次做一题,那些推理慢的模型,有可能俩小时都做不完题。这说明在难题面前,部分模型的能力还是有限的。

简单之题之速

接着一道题难度降下来了,讯飞星火、文心一言、Kimi、通义千问、DeepSeek这五款大模型嗖嗖就把正确答案算出来,文心一言几乎就像闪电一样快算出来。像豆包、讯飞星火、Kimi、文心一言、DeepSeek还是一直表现不错,又正确算出两道题答案。简单题上大模型展露了它们的快速计算能力。

数学高考模型与技巧_数学考满分的牲口_

能力提升之幸

想想去年复旦大学NLP实验室测试AI大模型面对高考数学题时那糟糕的表现,还有小雷之前测试类似的结果都不太好。可今年,模型基本能算出正确答案,曾经折磨它们的多选题,也难不住它们。AI大模型数学解答能力提升,学生群体估计能从中收获不少好处,以后学习啥的或许会多些助力。

_数学高考模型与技巧_数学考满分的牲口

所以这企业暂停AI模型的相关服务是不是过度反应大家还是有分歧。我就想问朋友们,你们觉得企业这么暂停服务是必要之举还是反应过度?觉得这文章有点意思的就点个赞、分享分享!

数学高考模型与技巧_数学考满分的牲口_

Copyright © 2002-2025 大连市同乐中小企业商会 版权所有 Powered by EyouCms
电话:15556325500 地址:大连市中山区独立街31号远达大厦B座1802室 备案号:辽ICP备16005699号-1
网站地图