又黄又爽又猛大片录像,国产精品嫩草研究院成人,最新内地三级在线观看

谷歌Gemini Deep Think AI獲官方認證奧數(shù)金牌

人類頂級的智力高地失守！

日期： 2025-07-22

來源：網(wǎng)易科技

關(guān)鍵詞： Google DeepMind AI OpenAI

7月22日消息，AI霸權(quán)之爭已達到新的頂峰，Google DeepMind和OpenAI現(xiàn)在都聲稱，其模型可以征服國際數(shù)學奧林匹克競賽（IMO），這堪稱人類最艱難的智力挑戰(zhàn)之一。

美國時間周一，谷歌宣布其Gemini Deep Think AI在2025年IMO比賽中獲得了官方認證的金牌。而在幾天前，其競爭對手OpenAI也宣布，其模型在同樣的比賽中獲得了相同的頂級分數(shù)，但OpenAI的成績尚未經(jīng)過正式認證。

這一突破標志著AI推理能力的一次巨大飛躍，證明了通用型AI模型能夠在解決復雜數(shù)學問題時達到人類頂尖水平。與此同時，這一進展也進一步加劇了兩大AI巨頭之間的競爭。

AI挑戰(zhàn)人類智力巔峰

國際數(shù)學奧林匹克（IMO）是全球最具聲望的青少年數(shù)學競賽，始于1959年，每年舉辦一次。每個參賽國派出六名頂尖中學生數(shù)學選手，他們需解答六個在代數(shù)、組合學、幾何學和數(shù)論等領(lǐng)域極其復雜的問題。其中，約8%的參賽者將獲得一枚聲望卓著的金牌。

近年來，IMO逐漸成為了AI系統(tǒng)的一個重要挑戰(zhàn)平臺，用以測試AI在數(shù)學問題解決和推理能力上的最新進展。去年，Google DeepMind的AlphaProof和AlphaGeometry 2聯(lián)合系統(tǒng)曾達到銀牌水平，解決了四個問題并獲得28分。這一突破依賴于專門的形式化語言，展示了AI在接近人類頂級數(shù)學推理能力方面的進展。

今年，Google DeepMind的Gemini模型提交的結(jié)果首次經(jīng)過IMO協(xié)調(diào)員的官方評分和認證，評分標準與學生選手一致。在肯定今年學生選手所取得的顯著成就之余，谷歌也分享了Gemini在此次比賽中的突破性表現(xiàn)。

從銀牌到金牌：AI推理的飛躍

Gemini Deep Think的高級版本在2025年IMO中表現(xiàn)出色，完美解決了六個極難問題中的五個，獲得了總分35分，達到了金牌水平。這些解決方案已經(jīng)在線公開，任何人都可以在線查看并驗證其正確性。

IMO主席格雷戈爾·多利納爾（Gregor Dolinar）教授表示：“我們可以確認，Google DeepMind已經(jīng)達到了人們非常期待的里程碑，在滿分42分中獲得了35分——這是一個金牌分數(shù)。他們的解決方案在許多方面都令人驚嘆。IMO的評分員發(fā)現(xiàn)它們清晰、精確，且大多數(shù)都易于理解。”

與去年的成績相比，谷歌今年的成就具有里程碑意義。2024年，谷歌的AlphaGeometry和AlphaProof系統(tǒng)雖然達到了銀牌標準，但當時它們依賴于專家首先將問題從自然語言轉(zhuǎn)化為專用的領(lǐng)域語言（如Lean），而證明過程則需要反向操作，整個過程也需要兩到三天的計算時間。

今年，Gemini模型的一個關(guān)鍵創(chuàng)新是能夠全程使用自然語言進行操作，直接從官方的題目描述中生成嚴謹?shù)臄?shù)學證明。這一切都在嚴格的4.5小時比賽時間限制內(nèi)完成。

“批量制造”真正的AI數(shù)學家？

OpenAI與谷歌都將最近在IMO上取得的成就視為通用AI的重要勝利。OpenAI研究員諾姆·布朗（Noam Brown）在社交媒體上表示：“恭喜Google DeepMind團隊在IMO上取得的成績！我認為他們的成功再次突顯了AI進步的速度。雖然他們的方法與我們有所不同，但這正顯示了AI研究領(lǐng)域可以探索的多樣化方向。這不僅是一個針對IMO的專門模型，而是一個融合了新型實驗性通用技術(shù)的推理型大語言模型。”

布朗的觀點得到了OpenAI同事們的認可。這表明，谷歌和OpenAI的基礎(chǔ)模型不僅僅是針對數(shù)學問題的狹義專家，更具備廣泛的能力，能夠應對多種復雜任務。

OpenAI選擇自行公布成績，凸顯了在“公司內(nèi)部面臨挑戰(zhàn)的背景下，急于展現(xiàn)領(lǐng)導力”的巨大壓力。OpenAI首席執(zhí)行官山姆·奧特曼（Sam Altman）也提到了這一成就的重要性：“當我們剛開始OpenAI時，這（指在IMO奪金）一直是一個夢想，但那個時候我們并不覺得它能夠?qū)崿F(xiàn)。”此次成功有力地反擊了關(guān)于OpenAI正失去競爭力的言論。

而谷歌的系統(tǒng)則依賴于其新推出的Gemini Deep Think架構(gòu)，這是一種增強型推理模式，專門用于處理復雜問題。它融合了谷歌最新的研究技術(shù)，包括“并行思維”，這種設(shè)置使模型能夠在給出最終答案之前，同時探索并結(jié)合多種可能的解決方案，而不是追求單一的、線性的思維鏈。

為了最大限度地發(fā)揮Deep Think的推理能力，谷歌還引入了最新的強化學習技術(shù)，使其能利用更多的多步驟推理、問題解決和定理證明的數(shù)據(jù)來進行學習。此外，谷歌為Gemini提供了一個經(jīng)過精心篩選的高質(zhì)量數(shù)學問題解決方案語料庫，并在其指令中添加了如何高效解決IMO問題的通用提示和技巧。

谷歌計劃將這一版本的Deep Think模型提供給一批受信任的測試人員，包括數(shù)學家，之后再向Google AI Ultra訂閱者推出。

AI與數(shù)學的未來

盡管取得了突破，但AI推理技術(shù)目前仍處于實驗階段。OpenAI研究員亞歷山大·韋（Alexander Wei）表示：“這一成就攻克了AI領(lǐng)域長期以來的一個重大挑戰(zhàn)，我很高興地分享OpenAI最新的實驗性推理型大語言模型已經(jīng)在全球最具聲望的數(shù)學競賽中達到了金牌水平。”

Google DeepMind的高級研究科學家Thang Luong對未來充滿信心：“我們非常有信心，很快就能把模型交到我們所信任的測試人員手中，尤其是數(shù)學家，幫助他們解決更復雜的問題，之后再推出給更廣泛的用戶群體。”

Google DeepMind與數(shù)學界的合作正在持續(xù)進行，但AI為數(shù)學貢獻的潛力仍處于起步階段。通過讓AI系統(tǒng)能夠進行更加靈活和直觀的推理，谷歌正在一步步接近構(gòu)建能解決更復雜和高級數(shù)學問題的AI。

盡管今年的工作完全基于自然語言的Gemini，谷歌仍在持續(xù)推進其他AI系統(tǒng)，包括AlphaGeometry和AlphaProof。

谷歌相信，那些結(jié)合了自然語言流暢性與嚴格推理的智能體，包括在形式化語言中經(jīng)過驗證的推理，將成為數(shù)學家、科學家、工程師和研究人員不可或缺的工具，幫助推動人類知識的進步，并為通用人工智能（AGI）奠定基礎(chǔ)。

Magazine.Subscription.jpg

版權(quán)聲明：本站內(nèi)容除特別聲明的原創(chuàng)文章之外，轉(zhuǎn)載內(nèi)容只為傳遞更多信息，并不代表本網(wǎng)站贊同其觀點。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問題，請及時通過電子郵件或電話通知我們，以便迅速采取適當措施，避免給雙方造成不必要的經(jīng)濟損失。聯(lián)系電話：010-82306118；郵箱：aet@chinaaet.com。

谷歌Gemini Deep Think AI獲官方認證奧數(shù)金牌

日期： 2025-07-22

來源：網(wǎng)易科技

相關(guān)內(nèi)容