接近金牌水平,AI向人類奧數(shù)“下手”


從下棋到解析蛋白質(zhì)結(jié)構(gòu),人工智能(AI)變得越來越無所不能。美國谷歌公司的DeepMind這次將目標(biāo)瞄準(zhǔn)數(shù)學(xué)領(lǐng)域,開發(fā)的一款A(yù)I幾何推理模型——AlphaGeometry能夠以接近國際數(shù)學(xué)奧林匹克(奧數(shù))競賽金牌得主的水平,解決復(fù)雜的幾何問題。相關(guān)研究1月17日發(fā)表于《自然》。
奧數(shù)面向中學(xué)生每年7月舉辦,是全球最難的數(shù)學(xué)競賽之一。解決奧數(shù)幾何問題需要一定的數(shù)學(xué)創(chuàng)造力,而這正是AI一直在試圖攻克的。即使在其他領(lǐng)域展現(xiàn)出非凡推理能力的OpenAI的GPT-4,在奧數(shù)幾何問題上也只能得0分。
AI之所以對奧數(shù)幾何問題久攻不下,除了問題的難度外,缺乏訓(xùn)練數(shù)據(jù)也是一個很重要的原因。奧數(shù)自1959年以來每年舉辦一次,且每次比賽只有6道題。然而,AI系統(tǒng)解決幾何問題需要數(shù)百萬甚至數(shù)十億個數(shù)據(jù)點(diǎn),現(xiàn)有數(shù)據(jù)遠(yuǎn)不能滿足訓(xùn)練的需要。
為此,DeepMind的Thang Luong和同事創(chuàng)建了一種工具,可生成數(shù)以億計的機(jī)器可讀的幾何證明,從而繞過了現(xiàn)有數(shù)據(jù)不足的難點(diǎn)。
研究人員使用這些數(shù)據(jù)對AlphaGeometry進(jìn)行訓(xùn)練,并用30道奧數(shù)幾何題對它進(jìn)行基準(zhǔn)測試。結(jié)果,AlphaGeometry在標(biāo)準(zhǔn)時限內(nèi)正確解出了25道題。相比之下,之前最先進(jìn)的系統(tǒng)解決了其中10道題,而根據(jù)預(yù)測,人類奧數(shù)金牌得主平均解決25.9道題。
Luong介紹,AlphaGeometry由兩部分組成,一個是快速、直觀的語言模型系統(tǒng)——GPT-f,另一個是較慢、更具分析性的“符號引擎”系統(tǒng)。
面對一道奧數(shù)幾何題,AlphaGeometry首先利用GPT-f提出要嘗試的定理和論點(diǎn),接著“符號引擎”就會通過邏輯推理,按照數(shù)學(xué)規(guī)則構(gòu)建GPT-f提出的論點(diǎn)。兩個系統(tǒng)協(xié)同工作、不斷切換,直到問題解決。
Luong表示,雖然AlphaGeometry在解決奧數(shù)幾何題方面非常成功,但它的答案往往比人類的證明更長。不過,它可以發(fā)現(xiàn)一些人類遺漏的東西。比如,它對一道2004年奧數(shù)競賽題的解法,比官方給出的答案更好、更通用。
英國倫敦數(shù)學(xué)科學(xué)研究所的何楊輝指出,該系統(tǒng)在可用的數(shù)學(xué)運(yùn)算方面存在固有的局限性,因?yàn)閵W數(shù)問題應(yīng)該用大學(xué)本科階段以下教授的定理來解決。因此,增加AlphaGeometry可以獲得的數(shù)學(xué)知識能夠改善系統(tǒng),甚至有助于它取得新的數(shù)學(xué)發(fā)現(xiàn)。
目前,DeepMind拒絕透露是否計劃讓AlphaGeometry參加奧數(shù)現(xiàn)場比賽,以及是否再擴(kuò)展該系統(tǒng)以解決其他非幾何奧數(shù)問題。
(徐銳)
相關(guān)論文信息:
https://doi.org/10.1038/s41586-023-06747-5
本文鏈接:http://knowith.com/news-7-141.html接近金牌水平,AI向人類奧數(shù)“下手”
聲明:本網(wǎng)頁內(nèi)容由互聯(lián)網(wǎng)博主自發(fā)貢獻(xiàn),不代表本站觀點(diǎn),本站不承擔(dān)任何法律責(zé)任。天上不會到餡餅,請大家謹(jǐn)防詐騙!若有侵權(quán)等問題請及時與本網(wǎng)聯(lián)系,我們將在第一時間刪除處理。
界別聯(lián)組會上委員共議 高質(zhì)量推進(jìn)北京國際科創(chuàng)中心建設(shè)
北京市林草新品種數(shù)量超過600個
我學(xué)者觀測到一類高階非厄米奇異點(diǎn)結(jié)構(gòu)
我國新一代氣象超算系統(tǒng)建成
科技部關(guān)于印發(fā)《國家科學(xué)技術(shù)獎提名辦法》的通知
推動科技向善 把好倫理“方向盤”——科技部有關(guān)負(fù)責(zé)人解讀《科技倫理審查辦法(試行)》
內(nèi)蒙古準(zhǔn)格爾經(jīng)濟(jì)開發(fā)區(qū)“碳尋”固廢綜合利用路徑
第七屆中關(guān)村國際前沿科技大賽境外賽區(qū)醫(yī)藥健康領(lǐng)域決賽舉辦
2023年度科技部《政府網(wǎng)站監(jiān)管年度報表》
【申報】關(guān)于征集2024年度新三板掛牌補(bǔ)貼支持資金項目的通知
大年初五迎財神,武漢歸元寺香客如潮
完整價格公開!2025年購買老撾恩西地平一盒價格在多少錢:老撾印度恩西地平50mg*30粒價格在1599元
印度厄洛替尼代購最佳方法是什么?印度厄洛替尼多少錢一盒(150mg30粒)價格折合人民幣約1200元起,肺癌印度厄洛替尼代購價格yb價格一覽表