DeepMind宣布AI测试分数
发布时间:2025-07-25 10:57
根据新华社的说法,Google的DeepMind公司于7月21日宣布,“双子座”人工智能(AI)测试的高级版本具有“深思熟虑”功能,达到了国际数学奥林匹克(IMO)的金色水平,并且该分数已正式证明。国际数学奥林匹克运动会主席格雷戈尔·多利纳尔(Gregor Dolinal)教授说:“我们可以确认Google DeepMind达到了高度预期的里程碑,在总共42分中获得了35分 - 达到(今年)是金牌标记线。”他在许多方面称呼该问题的解决方案“令人惊叹”。国际数学奥林匹克徒得分手认为,这些方案清晰,准确,大多数易于理解。自1959年以来,国际数学奥林匹克运动会每年都举行。参与者需要在两天的代数数学,几何学和数字理论的四个主要领域中回答六个非常困难的问题(4.5小时是的)。 DeepMind推出的AI字母隔板和字母测定法2型在2024年国际数学奥林匹克运动会上回答了6个问题中的4个,达到了当年的银牌水平,标记为28分。为了使这两个模型理解问题,专家首先将问题从自然语言转化为特定的计算机语言,总共需要两到三天才能计算问题。今年,与去年相比,“双子座”测试结果的高级版本已取得了重大发展。它直接提供了数学基于自然语言中描述的问题的证明,并在竞争时间限制内完成了挑战。 DeepMind说,今年取得的ANG结果是由于Gemini的“深思熟虑”模型的先进版本是一种增强的对复杂问题推理的模型,该模型结合了诸如“平行思想”之类的最新技术。这种模式的设置使模型可以探索并在给出最终答案之前同时将许多可能的解决方案结合在一起,而不是采用单一的线性方法进行。