OpenAI 声称新模型获得 IMO 金牌不到 24 小时,剧情就出现了大反转!
多位 IMO 官方人士和学界大佬纷纷发声,直指 OpenAI 的做法“粗鲁且不恰当”。
IMO 主办方要求 AI 公司在闭幕式一周后再公布结果,让关注的焦点留在参赛的青少年上,然而 OpenAI 偏偏选择在闭幕式刚结束就急不可耐地宣布了成绩。
有网友评价:OpenAI 一如既往地为了炒作什么都干得出来。没有官方分数,没有耐心,也没有羞耻心。
更劲爆的是,OpenAI 自称的“金牌”成绩可能根本站不住脚:
OpenAI 并不是与 IMO 合作测试模型的 AI 公司之一,91 位 IMO 官方评委中没有任何人参与评估他们的答卷。这意味着,OpenAI 的”金牌”成绩完全是自说自话,没有经过官方认证。
原本以为是 AI 发展的里程碑时刻,没想到引发了一场关于学术道德和商业炒作的激烈争论。
IMO 官方怒了:”请给孩子们留点空间”
事情的导火索来自一位 IMO 资深人士的爆料。
Joseph Myers,这位从 1992 年就参与数学奥赛的元老级人物,与 IMO 秘书长 Ria van Huffel 进行了一番交谈。
IMO 评审团和协调员们普遍认为,AI 开发商在 IMO 期间(尤其是闭幕式之前)宣布成绩是”粗鲁且不恰当的”。官方期望 AI 公司在闭幕式后至少等待一周再发布结果。
OpenAI 方面,则由参与这项研究的 Noam Brown 出面回应。
他的发言承认了 OpenAI 没有事先与 IMO 官方取得联系,只是在发布成绩之前告知了一位组织者,组织者要求他们在闭幕式之后再宣布成绩。
这与爆料中的要求闭幕式一周之后出现了矛盾。
那么事情到底如何呢?
另一家参加比赛的 AI 团队 Harmonic 的公告证实,确实有“闭幕式一周之后”这个要求,而且给出了具体时间期限 7 月 28 日之后。
就在 OpenAI 高调宣布成绩的同时,另一家 AI 巨头谷歌 DeepMind 却很克制,与 OpenAI 的张扬形成鲜明对比。
多位知情人士透露,DeepMind 可能也取得了金牌水平的成绩,但他们选择遵守 IMO 的要求,静静等待合适的时机。
除了公告发布时间的问题,OpenAI 到底得没得金牌也有争议。
领导 DeepMind 超级推理团队的 Thang Luong 补充,IMO 内部其实有一份官方评分指南,外部无法获取。没有基于该指南的评分就没有资格获得奖牌。
这届 IMO 共 6 道题,每题 7 分。金牌线 35 分,OpenAI 自报的成绩也刚刚过线,即使是解答过程中微小的扣分都可能让 OpenAI 从金牌跌到银牌。
总之这场 IMO 金牌之争还远未结束,一切还是以经过 IMO 主办方认证的成绩为准。
One More Thing
最后让我们将聚光灯交还给人类金牌选手。
最终成绩中,中国队以全员 6 金牌、总分 231 分占据榜首,继去年以 2 分之差遗憾输给老对手美国队后,再度重返世界第一。
第二名则是美国队,获得了 5 金一银,然后依次是韩国、日本和波兰。
中国队的六位选手分别是来自武昌实验中学的邓哲文、武汉市经开外国语高级中学的徐祺铭和谈弘毅、重庆巴蜀中学的张恒烨、杭州学军中学的董镇宇,以及上海中学的邓乐言。
其中邓哲文和徐祺铭都曾参与过 2024 年的 IMO 并成功摘金,而徐祺铭更是在去年成功入选 2025 年北大数学英才班。
董镇宇则是团队中唯一的高三年级,虽然他早在高一就进入国家集训队并被保送至清华姚班,但前两年的选拔中都与 IMO 国家队擦肩而过。
这是他第三次冲击国家队,终于百折不挠圆梦 IMO。
谈弘毅在连续两年凭借中国数学奥林匹克竞赛(CMO)金牌入选国家集训队后,也同样获得了清华北大保送资格。
另外,邓乐言和张恒烨在本次 IMO 拿下满分 42 分,并列世界第一,这也是中国队从 2019 年起,连续 7 届 IMO 均有选手获得满分。
其中,邓乐言是中国队中年级最小的一位,只有高一的他,在去年 CMO 以满分成绩入选国家集训队,又在 IMO 国家队选拔中脱颖而出,刷新了上海近 10 年来 IMO 选手的最小年龄纪录。
去年,他还在阿里巴巴全球数学竞赛中的组合与概率赛道获得全球第五名,也是首位获得该项赛事奖牌的中学生。
张恒烨曾在 2023 年 CMO 中获得金牌并入选国家队,后来同样在阿里巴巴全球数学竞赛中获奖。去年入选国家队后,他还主动前往北大数学系旁听并受益匪浅。
要知道,本次 IMO 中,全球 600 多位参赛者,只有 6 人获得满分,其他所有人几乎都输在了第六题 —— 组合数学上,这也是 OpenAI 唯一没有攻克的那道题。
另外,下一届 IMO 将在上海中学举办,上海中学至今已获得 18 块 IMO 金牌,总数位居全国第一,它也将成为全球第一所承办国际数学奥林匹克的中学。
值得注意的是,今年 IMO 的前 30 名参赛者,几乎都是亚洲或东欧面孔。
而亚军美国队也是清一色的亚洲面孔。
网友表示,也许未来的数学竞赛将是中国队 vs 美国队 vs 人工智能。
参考链接:
[1]https://x.com/HarmonicMath/status/1947023450578763991
[2]https://www.imo-official.org/
[3]https://x.com/ai_for_success/status/1946984782178709719
[4]https://x.com/lmthang/status/1946960256439058844