IMO 怒斥 OpenAI 自封夺金:“91 位评委均未参与评分”
创始人
2025-07-21 16:05:31
0

OpenAI 声称新模型获得 IMO 金牌不到 24 小时,剧情就出现了大反转!

多位 IMO 官方人士和学界大佬纷纷发声,直指 OpenAI 的做法“粗鲁且不恰当”。

IMO 主办方要求 AI 公司在闭幕式一周后再公布结果,让关注的焦点留在参赛的青少年上,然而 OpenAI 偏偏选择在闭幕式刚结束就急不可耐地宣布了成绩。

有网友评价:OpenAI 一如既往地为了炒作什么都干得出来。没有官方分数,没有耐心,也没有羞耻心。

更劲爆的是,OpenAI 自称的“金牌”成绩可能根本站不住脚:

OpenAI 并不是与 IMO 合作测试模型的 AI 公司之一,91 位 IMO 官方评委中没有任何人参与评估他们的答卷。这意味着,OpenAI 的”金牌”成绩完全是自说自话,没有经过官方认证。

原本以为是 AI 发展的里程碑时刻,没想到引发了一场关于学术道德和商业炒作的激烈争论。

IMO 官方怒了:”请给孩子们留点空间”

事情的导火索来自一位 IMO 资深人士的爆料。

Joseph Myers,这位从 1992 年就参与数学奥赛的元老级人物,与 IMO 秘书长 Ria van Huffel 进行了一番交谈。

IMO 评审团和协调员们普遍认为,AI 开发商在 IMO 期间(尤其是闭幕式之前)宣布成绩是”粗鲁且不恰当的”。官方期望 AI 公司在闭幕式后至少等待一周再发布结果。

OpenAI 方面,则由参与这项研究的 Noam Brown 出面回应。

他的发言承认了 OpenAI 没有事先与 IMO 官方取得联系,只是在发布成绩之前告知了一位组织者,组织者要求他们在闭幕式之后再宣布成绩。

这与爆料中的要求闭幕式一周之后出现了矛盾。

那么事情到底如何呢?

另一家参加比赛的 AI 团队 Harmonic 的公告证实,确实有“闭幕式一周之后”这个要求,而且给出了具体时间期限 7 月 28 日之后。

就在 OpenAI 高调宣布成绩的同时,另一家 AI 巨头谷歌 DeepMind 却很克制,与 OpenAI 的张扬形成鲜明对比。

多位知情人士透露,DeepMind 可能也取得了金牌水平的成绩,但他们选择遵守 IMO 的要求,静静等待合适的时机。

除了公告发布时间的问题,OpenAI 到底得没得金牌也有争议。

领导 DeepMind 超级推理团队的 Thang Luong 补充,IMO 内部其实有一份官方评分指南,外部无法获取。没有基于该指南的评分就没有资格获得奖牌。

这届 IMO 共 6 道题,每题 7 分。金牌线 35 分,OpenAI 自报的成绩也刚刚过线,即使是解答过程中微小的扣分都可能让 OpenAI 从金牌跌到银牌。

总之这场 IMO 金牌之争还远未结束,一切还是以经过 IMO 主办方认证的成绩为准。

One More Thing

最后让我们将聚光灯交还给人类金牌选手。

最终成绩中,中国队以全员 6 金牌、总分 231 分占据榜首,继去年以 2 分之差遗憾输给老对手美国队后,再度重返世界第一。

第二名则是美国队,获得了 5 金一银,然后依次是韩国、日本和波兰。

中国队的六位选手分别是来自武昌实验中学的邓哲文、武汉市经开外国语高级中学的徐祺铭谈弘毅、重庆巴蜀中学的张恒烨、杭州学军中学的董镇宇,以及上海中学的邓乐言

其中邓哲文徐祺铭都曾参与过 2024 年的 IMO 并成功摘金,而徐祺铭更是在去年成功入选 2025 年北大数学英才班。

董镇宇则是团队中唯一的高三年级,虽然他早在高一就进入国家集训队并被保送至清华姚班,但前两年的选拔中都与 IMO 国家队擦肩而过。

这是他第三次冲击国家队,终于百折不挠圆梦 IMO。

谈弘毅在连续两年凭借中国数学奥林匹克竞赛(CMO)金牌入选国家集训队后,也同样获得了清华北大保送资格。

另外,邓乐言和张恒烨在本次 IMO 拿下满分 42 分,并列世界第一,这也是中国队从 2019 年起,连续 7 届 IMO 均有选手获得满分。

其中,邓乐言是中国队中年级最小的一位,只有高一的他,在去年 CMO 以满分成绩入选国家集训队,又在 IMO 国家队选拔中脱颖而出,刷新了上海近 10 年来 IMO 选手的最小年龄纪录。

去年,他还在阿里巴巴全球数学竞赛中的组合与概率赛道获得全球第五名,也是首位获得该项赛事奖牌的中学生。

张恒烨曾在 2023 年 CMO 中获得金牌并入选国家队,后来同样在阿里巴巴全球数学竞赛中获奖。去年入选国家队后,他还主动前往北大数学系旁听并受益匪浅。

要知道,本次 IMO 中,全球 600 多位参赛者,只有 6 人获得满分,其他所有人几乎都输在了第六题 —— 组合数学上,这也是 OpenAI 唯一没有攻克的那道题。

另外,下一届 IMO 将在上海中学举办,上海中学至今已获得 18 块 IMO 金牌,总数位居全国第一,它也将成为全球第一所承办国际数学奥林匹克的中学。

值得注意的是,今年 IMO 的前 30 名参赛者,几乎都是亚洲或东欧面孔。

而亚军美国队也是清一色的亚洲面孔。

网友表示,也许未来的数学竞赛将是中国队 vs 美国队 vs 人工智能。

参考链接:

  • [1]https://x.com/HarmonicMath/status/1947023450578763991

  • [2]https://www.imo-official.org/

  • [3]https://x.com/ai_for_success/status/1946984782178709719

  • [4]https://x.com/lmthang/status/1946960256439058844

相关内容

热门资讯

《忍者龙剑传4》新实机视频 流... 近日忍者组官方分享了《忍者龙剑传4》新实机视频,展示了主角流畅且帅气的连招。“在战斗中使用你解锁的所...
光之战士再别蓉城 《最终幻想1... 上周周末,成都的”狒狒“十四浓度有点高。《最终幻想14》参展了成都CD29漫展,众多光之战士们线下聚...
《七日杀》2.0版更新背叛核心... 今年6月底,《七日杀》2.0版重大更新“风暴将至”上线,然而此次更新让玩家们很不满,最近30天评价跌...
原创 一... 火影忍者手游中有这么一个忍者,提到他的名字,总是会说没起手的,还有被各种严父忍者克制。但实际上这个忍...
OPPO K13 Turbo ... 今天来跟大家聊一聊OPPO K13 Turbo Pro,看看这款OPPO K系列中的首款Turbo机...
原创 F... Faker退位,进入Chovy王朝!GEN拿到恐怖的26连胜,圣枪哥都要哭了 石油杯最后一场总决赛也...
让我再贪一柱子!类银+RPG佳... 背上沉重的幻影之住,在被黑暗笼罩的世界里探寻真相。《伏魔行者》是一款黑暗画风的国产类银河恶魔城游戏。...
风靡的“血色海龟汤”与小学生们... “一个马戏团里有两个侏儒,可是这天早上有一个侏儒在家自杀了,现场还有一地木屑,你猜为什么?” “他俩...
OPPO K13 Turbo系... 凤凰网科技讯(作者/于雷)7月21日 OPPO今日正式推出了其K系列全新力作——OPPO K13 T...
新游戏「救救小动物」上线啦! 🐰 可爱的小动物们堵在了草原上 🐟 每局 1~3 分钟,超级适合摸鱼 👇更多游戏,
恐龙的N副面孔:打工?战斗?带... 在观影驯龙高手电影的时候,你是否被画面中那形态各异、充满灵性的飞龙所深深吸引,渴望拥有属于自己的独一...
大厂入局、产品扎堆,今年Ste... 2025年已经来到了第3季度,在存量时代的大背景下,游戏行业的“集中度”越来越高,手握头部产品的厂商...
IMO 怒斥 OpenAI 自... OpenAI 声称新模型获得 IMO 金牌不到 24 小时,剧情就出现了大反转! 多位 IMO 官方...
原创 刺... 自《刺客信条:影》公开宣传以来,官方用主角黑人弥助编写的故事背景遭到了不少争议,尤其是在东亚地区,许...
红魔10S Pro系列内置PC... 红魔游戏手机近日带来了一个令人振奋的消息,其最新的红魔10S Pro系列将率先推出内置PC模拟器功能...
种田肉鸽养恐龙,当其他玩家还在... 可以双人联机的肉鸽种田游戏来了!steam最新沙盒冒险Roguelike游戏,《恐龙小当家》前不久上...
开服四天还在修?王者搞男色经济... 大家周一好,我是X博士。 【热游情报】将由“新游动态”“全球热门”两个部分组成。 一句两句无法说清楚...
七月游戏圈最卷的一周!《黑神话... 新的一周又开始了,本周又会有哪些好玩的新游戏等着我们呢?一起来看看吧。 【热点新游】 划重点:《天龙...
2年前,那个让上百万男人疯狂的... 大家好,这里是每周一更新的《图个好游戏》,我是正惊小弟! 又到了我们看图挑游戏的日子,小弟只给大家推...
原创 新... 大家好我是指尖,新皮肤销量如何,用什么来判定?是我们见到的频率,还是玩家的口口相传? 我觉得官方商城...