OpenAI被曝IMO金牌「造假」,陶哲轩怒揭内幕!
创始人
2025-07-21 11:56:40
0

新智元报道

编辑:桃子 好困

【新智元导读】OpenAI高调摘下数学金牌,竟是自嗨!组委会内部人士透露,OpenAI不仅未与IMO官方合作,甚至无视赛事规则,在闭幕派对未结束前抢先官宣。全网怒批其不尊重人类选手,炒作过头。

原来,事情并非那么简单。

一位IMO内部人士透露,实际上OpenAI并没有和组委会合作,拿下AI金牌不一定真实有效。

最关键的是,他们违背了IMO规定的「公布时间」规则。

为了避免AI公司们抢夺人类学生的风头,IMO评审团要求:在闭幕式结束一周后再公布结果。

然而,OpenAI却在闭幕Party还未结束前,就发布了结果。

对此,谷歌DeepMind负责人Thang Luong表态,「是的,IMO组委会有一份不对外公开的官方评分标准」。

若未依据该标准进行评估,任何奖牌声明均无效。

扣除1分后应为银牌,而非金牌。

这么说来,OpenAI声称拿下IMO金牌,只是自嗨?!

OpenAI真面目被戳穿

抢夺学生风头

就在昨天,菲尔兹奖得主陶哲轩在一口气连发三条评论,暗指的就是OpenAI。

他表示,「自己不会评论任何未预先公开测试方法的AI竞赛成绩报告。在缺乏受控测试环境的情况下,AI的数学能力难以准确评估」。

另外,IMO组委会一位成员Joseph Myers透露,OpenAI并非是IMO合作测试模型的AI公司之一。

而且,阳光海岸的91位协调员(Coordinator)也无人参与结果评估。

P6题协调员表示,「IMO评审团和协调员一致认为,OpenAI此举显得失礼且不妥当」。

根据IMO规定,借助AI模型参赛的公司,需要在7月28日之后公布结果。

一家专注于数学AI初创公司Harmonic官方发文,从侧面印证了这一规定存在的准确性。

最新回应引热议

OpenAI研究科学家,德扑之父Noam Brown下场回应,给出了两点证明:

首先,团队是在闭幕式「之后」公开结果。闭幕式有直播记录,这一点很容易核实。

其次,他确认了OpenAI并未与IMO进行协调,只是在发帖前与一位组织者告知了此事。出于对参赛学生的尊重,要求OpenAI等到闭幕式结束后再发布——「我们也照做了」。

对此,有人还精细计算了闭幕式和公开结果的时间差。

IMO闭幕式的时间在7月19日(当地时间)下午4点举行闭幕式,直播时间1小时43分钟,结束时间不晚于5点43分。

再来看负责人Alexander Wei的发文时间,7月19日下午3:50(东八区),也就是当地时间的5点50分。

从时间来看,确实是OpenAI在IMO闭幕式结束7分钟后,才发布了公告。

即便如此,网友们仍旧看不惯OpenAI炒作风暴,而且根本没有给获奖学生留有余地。

而且,可以确定的是,OpenAI公布的结果,并没有得到IMO官方认证。

未来几天,谷歌DeepMind会正式发布AI夺下IMO 2025细节。

马库斯愤怒抨击,太符合品牌调性了。

UCLA数学教授

LLM短期内不会取代人类

针对LLM拿下IMO金牌事件,来自UCLA应用数学教授Ernest Ryu发表了自己的看法。

1. OpenAI IMO P1-P5的解答目测是正确的。

2. 第6题是一个明显新颖且难度更高的问题。可以说第1-5题仍在「标准」IMO解题技巧范围内,但第6题需要创造性思维。

他表示,根据自己使用LLM进行数学研究的经验,Gemini的表现优于ChatGPT。

但OpenAI抢先在周六宣布了结果,而谷歌DeepMind「慢科研」学术作风,让他们输掉了这场公关战。

不过,Ernest Ryu认为,在短期内,大模型不会取代数学家。

因为数学研究是,解决那些目前「没有人」知道如何解决的问题(训练数据分布之外),即类似IMO P6题。这需要极大的创造力,OpenAI的模型在IMO解题中恰恰缺乏这种能力。

然而,对于那些人类已有能力解决的问题(训练数据分布之内),LLM只会变得愈加强大。

在数学研究中,人们会将现有技术与新创意相结合,LLM将显著加速前一部分工作的实现。

Ernest Ryu还预测,在接下来十年里,越来越多的数学家将借助LLM来搜索证明框架中的已知部分,从而提升研究效率。

老一辈数学家或许会对此唏嘘不已,但年轻一代只会继续产出优秀成果。

参考资料:

相关内容

热门资讯

“怪兽 8号 THE GAME... 动画 “怪兽 8号” 改编自松本直也先生于集英社 “少年Jump+” 连载的同名超人气漫画作品。漫画...
《忍者龙剑传4》新实机视频 流... 近日忍者组官方分享了《忍者龙剑传4》新实机视频,展示了主角流畅且帅气的连招。“在战斗中使用你解锁的所...
光之战士再别蓉城 《最终幻想1... 上周周末,成都的”狒狒“十四浓度有点高。《最终幻想14》参展了成都CD29漫展,众多光之战士们线下聚...
《七日杀》2.0版更新背叛核心... 今年6月底,《七日杀》2.0版重大更新“风暴将至”上线,然而此次更新让玩家们很不满,最近30天评价跌...
原创 一... 火影忍者手游中有这么一个忍者,提到他的名字,总是会说没起手的,还有被各种严父忍者克制。但实际上这个忍...
OPPO K13 Turbo ... 今天来跟大家聊一聊OPPO K13 Turbo Pro,看看这款OPPO K系列中的首款Turbo机...
原创 F... Faker退位,进入Chovy王朝!GEN拿到恐怖的26连胜,圣枪哥都要哭了 石油杯最后一场总决赛也...
让我再贪一柱子!类银+RPG佳... 背上沉重的幻影之住,在被黑暗笼罩的世界里探寻真相。《伏魔行者》是一款黑暗画风的国产类银河恶魔城游戏。...
风靡的“血色海龟汤”与小学生们... “一个马戏团里有两个侏儒,可是这天早上有一个侏儒在家自杀了,现场还有一地木屑,你猜为什么?” “他俩...
OPPO K13 Turbo系... 凤凰网科技讯(作者/于雷)7月21日 OPPO今日正式推出了其K系列全新力作——OPPO K13 T...
新游戏「救救小动物」上线啦! 🐰 可爱的小动物们堵在了草原上 🐟 每局 1~3 分钟,超级适合摸鱼 👇更多游戏,
恐龙的N副面孔:打工?战斗?带... 在观影驯龙高手电影的时候,你是否被画面中那形态各异、充满灵性的飞龙所深深吸引,渴望拥有属于自己的独一...
大厂入局、产品扎堆,今年Ste... 2025年已经来到了第3季度,在存量时代的大背景下,游戏行业的“集中度”越来越高,手握头部产品的厂商...
IMO 怒斥 OpenAI 自... OpenAI 声称新模型获得 IMO 金牌不到 24 小时,剧情就出现了大反转! 多位 IMO 官方...
原创 刺... 自《刺客信条:影》公开宣传以来,官方用主角黑人弥助编写的故事背景遭到了不少争议,尤其是在东亚地区,许...
红魔10S Pro系列内置PC... 红魔游戏手机近日带来了一个令人振奋的消息,其最新的红魔10S Pro系列将率先推出内置PC模拟器功能...
种田肉鸽养恐龙,当其他玩家还在... 可以双人联机的肉鸽种田游戏来了!steam最新沙盒冒险Roguelike游戏,《恐龙小当家》前不久上...
开服四天还在修?王者搞男色经济... 大家周一好,我是X博士。 【热游情报】将由“新游动态”“全球热门”两个部分组成。 一句两句无法说清楚...
七月游戏圈最卷的一周!《黑神话... 新的一周又开始了,本周又会有哪些好玩的新游戏等着我们呢?一起来看看吧。 【热点新游】 划重点:《天龙...
2年前,那个让上百万男人疯狂的... 大家好,这里是每周一更新的《图个好游戏》,我是正惊小弟! 又到了我们看图挑游戏的日子,小弟只给大家推...