當(dāng)前位置：首頁 >產(chǎn)業(yè)經(jīng)濟(jì)>

這次是信息學(xué)選手中的奧數(shù)AlphaCode登上了新一期《科學(xué)》的封面

來源：IT之家作者:李陳默發(fā)布時(shí)間：2022-12-11 08:33 閱讀量：6217

DeepMind又加了一篇NS論文。

這次是信息學(xué)選手中的奧數(shù)AlphaCode登上了新一期《科學(xué)》的封面

這次是信息學(xué)選手中的奧數(shù)AlphaCode，登上了最新一期《科學(xué)》的封面。

沒錯(cuò)，就是那個(gè)潛入10次編程比賽并打出代碼，得分超過人類一半的編程AI。

并且在這篇新更新的論文中，DeepMind還首次透露了AlphaCode的一次通過率:66%。

也就是說，AlphaCode近三分之二的投稿都是AC。

CMU博世人工智能中心教授j·濟(jì)科·科爾特的最新綜述文章也發(fā)表在這一期《科學(xué)》雜志上。他認(rèn)為:

AlphaCode不只是復(fù)制現(xiàn)有的解決方案。

當(dāng)面對(duì)從未見過的編程問題時(shí)，它表現(xiàn)得非常好，不管它有多理解這項(xiàng)任務(wù)。

在DeepMind的官方推特下，還有很多人把AlphaCode和現(xiàn)在流行的炸雞ChatGPT聯(lián)系在一起。

有人迫不及待地想看到他們兩人同臺(tái)演出:

一次通過率66%

盡管是AI編程領(lǐng)域，GitHub的Copilot還是快進(jìn)到了收費(fèi)模式，甚至和程序員法庭上見。

但在DeepMind看來，AlphaCode就大不一樣了。

一方面，編程比賽本身對(duì)于AI來說是一個(gè)比純編程更復(fù)雜的任務(wù)，關(guān)鍵是為不可預(yù)見的問題構(gòu)建解決方案。

另一方面，在架構(gòu)方面，AlphaCode采用不同的機(jī)制對(duì)競(jìng)賽題的文本進(jìn)行編碼。

值得一提的是，AlphaCode玩的10場(chǎng)編程比賽都是來自Codeforces。

相比其他算法和數(shù)據(jù)結(jié)構(gòu)的編程競(jìng)賽，Codeforces更傾向于考察思維能力，也就是說AI不能僅僅通過反點(diǎn)來完成挑戰(zhàn)。

例如，這是Codeforces上1553D問題的描述:

有兩個(gè)字符串S和T，都是由小寫字母組成的對(duì)于字符串S，我們從前到后掃描整個(gè)字符串

如果按下退格鍵，從光標(biāo)前面到前一個(gè)取消刪除字符的所有字符都將被刪除。

也就是說，假設(shè)字符串S是abcbd，你分別在第一個(gè)位置和第四個(gè)位置按Backspace，那么就會(huì)得到字符串bd。

因?yàn)榈谝粋€(gè)光標(biāo)位置之前沒有字符，所以第一次沒有動(dòng)作第四個(gè)光標(biāo)位置之前的字符是C，最后一個(gè)未刪除的字符是A，所以按Backspace會(huì)刪除前三個(gè)字符bd

對(duì)于這個(gè)前提，我們需要解決以下幾個(gè)問題:

能不能把S串從前到后掃描一次讓S變成T如果可能，輸出YES，否則，輸出no

為了解決這個(gè)問題，AlphaCode給出了以下解決方案:

然后，我們只需要給出輸入的字符串編號(hào)和具體的字符串內(nèi)容，這樣程序就可以輸出相應(yīng)的結(jié)果:

第一組是亞貝巴，第二組是亞貝巴，第三組是aaa，第四組是aababa。

這個(gè)程序的輸出結(jié)果分別是YES，NO，NO，YES。

在解決問題的過程中，AlphaCode的解決問題的思路不再是黑箱。

它不僅成功地解決了問題，還顯示了代碼的相應(yīng)位置和注意亮點(diǎn):

以上只是AlphaCode解決的問題之一。

總體而言，在Codeforces平臺(tái)舉辦的編程競(jìng)賽模擬評(píng)測(cè)中，AlphaCode在平均參賽人數(shù)超過5000人的競(jìng)賽中排名前54.3%——擊敗了一半的參賽者。

而第一次提交的概率是66%。

AlphaCode如何讀取銘文代碼

那么，AlphaCode是靠什么原理取得這種勝利的呢。

它仍然基于預(yù)訓(xùn)練—微調(diào)范式，采用Transformer架構(gòu)，其中編碼器具有讀能力，解碼器具有寫能力。

發(fā)表在《科學(xué)》上的這篇論文也給出了更直觀的示意圖，并以Python為案例講解了具體的訓(xùn)練過程。

在預(yù)訓(xùn)練期間，研究人員會(huì)在GitHub上整理出各種代碼集，并將其喂給AlphaCode上的編碼器和解碼器。

以Python上的print為例，其中print是一個(gè)常用函數(shù)，即printout，hello是需要打印出來的具體內(nèi)容。

經(jīng)過預(yù)訓(xùn)練，模型具備了按指令完成任務(wù)的基本要求，其中編碼器負(fù)責(zé)生成指令，解碼器負(fù)責(zé)填充其余部分。

在微調(diào)環(huán)節(jié)，研究人員會(huì)對(duì)競(jìng)技編程比賽的數(shù)據(jù)集進(jìn)行整理，包括問題和解決方案，以煉金和磨煉為訓(xùn)練目標(biāo)，進(jìn)一步縮小搜索空間。

其中，問題以注釋#的形式交給編碼者學(xué)習(xí)，解決方案交給解碼者嘗試?yán)斫?

經(jīng)過微調(diào)后，解碼器知道如何通過編碼器生成注釋來嘗試輸出相應(yīng)的代碼。

經(jīng)過前期訓(xùn)練——微調(diào)，就到了最后的測(cè)評(píng)環(huán)節(jié)。

Codeforces的標(biāo)題會(huì)以注釋的形式直接給編碼者，解碼者會(huì)嘗試輸出數(shù)百萬個(gè)不同的程序在對(duì)它們進(jìn)行過濾和聚類之后，它將提交其中的10個(gè)來解決問題

對(duì)于AlphaCode的出現(xiàn)，有程序員調(diào)侃說可以在藝人旁邊排隊(duì)領(lǐng)救濟(jì)糧了。

不過，DeepMind對(duì)于AlphaCode的官方口吻并不是AI程序員，而是希望它以輔助角色的身份出現(xiàn)在編程工作中:

我們希望它可以作為軟件開發(fā)人員的助手，尤其是那些編程基礎(chǔ)為0的人。

論文地址:

參考鏈接:

。

鄭重聲明：此文內(nèi)容為本網(wǎng)站轉(zhuǎn)載企業(yè)宣傳資訊，目的在于傳播更多信息，與本站立場(chǎng)無關(guān)。僅供讀者參考，并請(qǐng)自行核實(shí)相關(guān)內(nèi)容。

即時(shí)閱讀

財(cái)經(jīng)視界

財(cái)經(jīng)圖文

湯臣倍健與美團(tuán)買藥達(dá)成深度戰(zhàn)略合作，攜手邁進(jìn)

2023年2月15日，湯臣倍健與美團(tuán)買藥在北京舉辦了2023
國(guó)泰君安:維持李寧買入評(píng)級(jí)預(yù)計(jì)2022年增長(zhǎng)

2021年收入增長(zhǎng)目標(biāo)應(yīng)能確保實(shí)現(xiàn)，2022年收入增長(zhǎng)預(yù)計(jì)將
國(guó)家外匯管理局批復(fù)同意開辟外匯“綠色通道”保

具體來看，一是簡(jiǎn)化業(yè)務(wù)流程和材料，便利北京冬奧會(huì)相關(guān)區(qū)域內(nèi)境
源達(dá)：指數(shù)前高附近震蕩這個(gè)位置操作一定進(jìn)退有

炒股就看金麒麟分析師研報(bào)，權(quán)威，專業(yè)，及時(shí)，全面，助您挖掘潛
索尼PS5三款全新配色DualSense手柄

，據(jù)索尼官方消息，新星粉，銀河紫，星光藍(lán)，三款全新配色Dua
《2021醫(yī)美行業(yè)白皮書》：今年中國(guó)醫(yī)美市場(chǎng)

，新氧數(shù)據(jù)顏究院發(fā)布《2021醫(yī)美行業(yè)白皮書》，白皮書顯示，

亚洲三级在线播放_国产精品亚洲二区在线_精品国产电影久久久久_免费popnhub国产在线视频 - 美女被艹网站

金財(cái)晚報(bào)

這次是信息學(xué)選手中的奧數(shù)AlphaCode登上了新一期《科學(xué)》的封面

即時(shí)閱讀

財(cái)經(jīng)視界

財(cái)經(jīng)圖文

熱門推薦