亚洲三级在线播放_国产精品亚洲二区在线_精品国产电影久久久久_免费popnhub国产在线视频 - 美女被艹网站

金財(cái)晚報(bào)

金財(cái)晚報(bào)

這次是信息學(xué)選手中的奧數(shù)AlphaCode登上了新一期《科學(xué)》的封面

來源:IT之家 作者:李陳默 發(fā)布時(shí)間:2022-12-11 08:33   閱讀量:6217   

DeepMind又加了一篇NS論文。

這次是信息學(xué)選手中的奧數(shù)AlphaCode登上了新一期《科學(xué)》的封面

這次是信息學(xué)選手中的奧數(shù)AlphaCode,登上了最新一期《科學(xué)》的封面。

沒錯(cuò),就是那個(gè)潛入10次編程比賽并打出代碼,得分超過人類一半的編程AI。

并且在這篇新更新的論文中,DeepMind還首次透露了AlphaCode的一次通過率:66%。

也就是說,AlphaCode近三分之二的投稿都是AC。

CMU博世人工智能中心教授j·濟(jì)科·科爾特的最新綜述文章也發(fā)表在這一期《科學(xué)》雜志上。他認(rèn)為:

AlphaCode不只是復(fù)制現(xiàn)有的解決方案。

當(dāng)面對(duì)從未見過的編程問題時(shí),它表現(xiàn)得非常好,不管它有多理解這項(xiàng)任務(wù)。

在DeepMind的官方推特下,還有很多人把AlphaCode和現(xiàn)在流行的炸雞ChatGPT聯(lián)系在一起。

有人迫不及待地想看到他們兩人同臺(tái)演出:

一次通過率66%

盡管是AI編程領(lǐng)域,GitHub的Copilot還是快進(jìn)到了收費(fèi)模式,甚至和程序員法庭上見。

但在DeepMind看來,AlphaCode就大不一樣了。

一方面,編程比賽本身對(duì)于AI來說是一個(gè)比純編程更復(fù)雜的任務(wù),關(guān)鍵是為不可預(yù)見的問題構(gòu)建解決方案。

另一方面,在架構(gòu)方面,AlphaCode采用不同的機(jī)制對(duì)競(jìng)賽題的文本進(jìn)行編碼。

值得一提的是,AlphaCode玩的10場(chǎng)編程比賽都是來自Codeforces。

相比其他算法和數(shù)據(jù)結(jié)構(gòu)的編程競(jìng)賽,Codeforces更傾向于考察思維能力,也就是說AI不能僅僅通過反點(diǎn)來完成挑戰(zhàn)。

例如,這是Codeforces上1553D問題的描述:

有兩個(gè)字符串S和T,都是由小寫字母組成的對(duì)于字符串S,我們從前到后掃描整個(gè)字符串

如果按下退格鍵,從光標(biāo)前面到前一個(gè)取消刪除字符的所有字符都將被刪除。

也就是說,假設(shè)字符串S是abcbd,你分別在第一個(gè)位置和第四個(gè)位置按Backspace,那么就會(huì)得到字符串bd。

因?yàn)榈谝粋€(gè)光標(biāo)位置之前沒有字符,所以第一次沒有動(dòng)作第四個(gè)光標(biāo)位置之前的字符是C,最后一個(gè)未刪除的字符是A,所以按Backspace會(huì)刪除前三個(gè)字符bd

對(duì)于這個(gè)前提,我們需要解決以下幾個(gè)問題:

能不能把S串從前到后掃描一次讓S變成T如果可能,輸出YES,否則,輸出no

為了解決這個(gè)問題,AlphaCode給出了以下解決方案:

然后,我們只需要給出輸入的字符串編號(hào)和具體的字符串內(nèi)容,這樣程序就可以輸出相應(yīng)的結(jié)果:

第一組是亞貝巴,第二組是亞貝巴,第三組是aaa,第四組是aababa。

這個(gè)程序的輸出結(jié)果分別是YES,NO,NO,YES。

在解決問題的過程中,AlphaCode的解決問題的思路不再是黑箱。

它不僅成功地解決了問題,還顯示了代碼的相應(yīng)位置和注意亮點(diǎn):

以上只是AlphaCode解決的問題之一。

總體而言,在Codeforces平臺(tái)舉辦的編程競(jìng)賽模擬評(píng)測(cè)中,AlphaCode在平均參賽人數(shù)超過5000人的競(jìng)賽中排名前54.3%——擊敗了一半的參賽者。

而第一次提交的概率是66%。

AlphaCode如何讀取銘文代碼

那么,AlphaCode是靠什么原理取得這種勝利的呢。

它仍然基于預(yù)訓(xùn)練—微調(diào)范式,采用Transformer架構(gòu),其中編碼器具有讀能力,解碼器具有寫能力。

發(fā)表在《科學(xué)》上的這篇論文也給出了更直觀的示意圖,并以Python為案例講解了具體的訓(xùn)練過程。

在預(yù)訓(xùn)練期間,研究人員會(huì)在GitHub上整理出各種代碼集,并將其喂給AlphaCode上的編碼器和解碼器。

以Python上的print為例,其中print是一個(gè)常用函數(shù),即printout,hello是需要打印出來的具體內(nèi)容。

經(jīng)過預(yù)訓(xùn)練,模型具備了按指令完成任務(wù)的基本要求,其中編碼器負(fù)責(zé)生成指令,解碼器負(fù)責(zé)填充其余部分。

在微調(diào)環(huán)節(jié),研究人員會(huì)對(duì)競(jìng)技編程比賽的數(shù)據(jù)集進(jìn)行整理,包括問題和解決方案,以煉金和磨煉為訓(xùn)練目標(biāo),進(jìn)一步縮小搜索空間。

其中,問題以注釋#的形式交給編碼者學(xué)習(xí),解決方案交給解碼者嘗試?yán)斫?

經(jīng)過微調(diào)后,解碼器知道如何通過編碼器生成注釋來嘗試輸出相應(yīng)的代碼。

經(jīng)過前期訓(xùn)練——微調(diào),就到了最后的測(cè)評(píng)環(huán)節(jié)。

Codeforces的標(biāo)題會(huì)以注釋的形式直接給編碼者,解碼者會(huì)嘗試輸出數(shù)百萬個(gè)不同的程序在對(duì)它們進(jìn)行過濾和聚類之后,它將提交其中的10個(gè)來解決問題

對(duì)于AlphaCode的出現(xiàn),有程序員調(diào)侃說可以在藝人旁邊排隊(duì)領(lǐng)救濟(jì)糧了。

不過,DeepMind對(duì)于AlphaCode的官方口吻并不是AI程序員,而是希望它以輔助角色的身份出現(xiàn)在編程工作中:

我們希望它可以作為軟件開發(fā)人員的助手,尤其是那些編程基礎(chǔ)為0的人。

論文地址:

參考鏈接:

鄭重聲明:此文內(nèi)容為本網(wǎng)站轉(zhuǎn)載企業(yè)宣傳資訊,目的在于傳播更多信息,與本站立場(chǎng)無關(guān)。僅供讀者參考,并請(qǐng)自行核實(shí)相關(guān)內(nèi)容。

mangren

財(cái)經(jīng)視界

財(cái)經(jīng)圖文

熱門推薦

金財(cái)晚報(bào)僅作為用戶獲取信息之目的,并不構(gòu)成投資建議。市場(chǎng)有風(fēng)險(xiǎn) 投資需謹(jǐn)慎。

網(wǎng)站地圖

Copyright 2018- 金財(cái)晚報(bào) All Rights Reserved 聯(lián)系我們: 備案號(hào):蜀ICP備13010463號(hào)