如何看待机器之心重测高考数学全卷,Gemini夺冠,豆包DeepSeek并列第二?
- 发表时间:2025-06-18 20:50:12
- 来源:
当务之急最该解决的问题是大众对于 AI大模型的正确认知以及最基本的AI用法。
你看这是前两天的测试结果,突出了一个政治正确,6款大模型,OpenAI的o3倒数第一,我当时看到的时候就觉得很奇怪,o3好歹也是曾经的一代王者,高考数学这种题它排名这么低怕不是有什么猫腻。
我们就拿单选题的第五题来测试下,因为这道题除了o3,其他的国产模型都答对了。
这是第五题的原题,正确答案是A. - 1/2。
这是之前的第三方的测试结果,6个模型…。
推荐资讯
- 2026-04-05 10:40:03再等 4 至 6 周!SpaceX 星舰 V3 首飞推迟至 5 月
- 2026-03-25 09:35:03华为千元机回归,手机市场要变天了?_畅享_系列_芯片
- 2026-03-26 23:00:03硅基美女建模脸火了,对视 3 秒,我再也没法把它当机器人_胡宇航_人形_Lipson
- 2026-04-07 21:40:01全球首次!我国钠离子电池重大突破:300℃不爆炸,阻断热失控_产业化_技术_***
- 2026-04-10 11:30:02心里发慌!华强北商家2万部手机压仓:废旧回收价却暴跌三成_价格_累计涨幅_芯片
- 2026-04-07 17:20:01程序员开发自动违章举报程序:曾目睹***现场受冲击,用AI三天生成网页版_海洋_识别_车辆
- 2026-03-27 20:50:04电商“仅退款”全面开打,淘宝、京东、拼多多2024开战 - *
- 2026-03-23 11:55:04人均年薪132万的地平线亏超104亿,钱去哪了?_余凯_公司_开支
- 2026-04-10 12:50:03估值2万亿的SpaceX业绩曝光:去年总营收突破185亿美元,亏损近50亿美元_航天_商业_合并
- 2026-04-07 15:20:02雷军、马云罕见联手!千寻智能30天累计融资30亿_机器人_资本_合作
推荐产品
-
游戏直播不太行了,但虎牙突然又行了?_总收入_***_内容
游戏直播不太行了,但虎牙突然又行了?_总收入_***_内容 -
说句实话,我挺关心Kimi接下来要走的路_模型_行业_产品
那时候的杨植麟,用一个产品切口,在巨头环伺的红海里撕开了一道口子,也向行业证明:没有巨头的流量和生态加持,独立AI创业公司也能靠对用户需求的精准把握,跑出自己的路。杨植麟需要证明的是,月之暗面不仅能做好产品… -
小米:天堂急跌地狱,拿什么撑住信仰?_汽车_业务_国补
小米:天堂急跌地狱,拿什么撑住信仰?_汽车_业务_国补 -
美团被曝删用户相册照片!有人6年回忆清空,有人被删504G……_手机_回应_***
小柴查阅发现,大量用户在社交媒体上发文吐槽美团,手机相册中的照片被美团删除,还有人表示,不仅删照片,还删***和录音文件。 “下午逛美团时手机弹提示,点开相册发现美团如同产生自主意识一般正在疯狂删除照片,也是很…
新闻动态
最新资讯
文章排行
- 200元废机拆出千元芯片?揭秘内存地下利益链_回收_手机_李一东
- 文科生“屠榜”时代到来!AI砸烂技术围墙,思想终于“干翻”代码_产品_财经媒体_开发周期
- 刚刚,Claude 4小时血洗全球最安全系统!人类最后防线失守_FreeBSD_内核_孔河
- 官宣!华为手机全面回归:公布CPU型号,支持5A网络,麒麟全国产突破制裁_芯片
- 实探手机涨价潮:荣耀、OPPO领涨300元起,小米、华为暂未跟进,千元机加速退场_机型_门店_销售
- 网购人脸识别属于个人信息过度收集 - *
- 遏制中企?美国AI三巨头罕见合作_模型_OpenAI_企业
- 三星再掀内存涨价潮,2026年二季度DRAM价格将平均上扬30%
- 先练脑还是先赚钱?人形机器人的“赌命”题_宇树_大脑_场景

