臨最近幾年底,谷歌終于放大招了!
在剛剛結束的AI年度盛會上,谷歌一口氣發布了四項最新的AIGC技術成果。
其中最引人注目的是文本圖像模型Imagen第一次測試,敲黑板安卓和蘋果這次可以玩了
其他有趣的產品包括LaMDA Wordcraft,這是一個AI寫作輔助工具,一個結合了Imagen Video和Phenaki優點的超長連貫視頻生成模型,等等。
而且,除了官方的總結,幾位來自谷歌的科學家也在推特上分享了他們在谷歌AI研究方面的新進展。
具體有哪些一起往下看
Imagen的首次公開測試
自推出以來,Imagen一直與OpenAI的DALL—E 2和Stability AI的Stable Diffusion相提并論,但不同的是,谷歌從未向公眾開放該系統。
現在,谷歌終于松口,宣布將Imagen加入其AI測試廚房應用。
谷歌在今年的I/O大會上推出的應用Test Kitchen用于測試各種AI系統目前蘋果和安卓用戶都可以下載
起初,用戶只能在上面與AI聊天機器人LaMDA 2進行交流此次更新將增加兩種與Imagen互動的新方式:城市夢想家和Wobble
在《城市夢想家》中,你可以使用文本命令來建造不同主題的城市,其中Imagen模型承擔了創建樣本建筑和地塊的角色。
在Wobble中,你可以創造一個小怪物,DIY它的材質,然后給它穿上你選擇的衣服,戳它讓它跳舞。
雖然與其他文本到圖像模式相比,這些交互模式似乎有限,但谷歌產品管理高級總監喬希·伍德沃德解釋說,這一步的意義在于獲得公眾對這些AI系統的反饋,并測試哪些行為會使系統崩潰。
其他AIGC產品
除了最受關注的Imagen模型,谷歌還公布了其他內容格式上的AI內容生成技術。
比如在大語言模型LaMDA基礎上開發的AI寫作工具LaMDA Wordcraft,可以輔助專業作家寫作。
值得一提的是,下圖中的評價性獨白是作家劉宇昆借助Wordcraft寫的一篇短篇小說。
此外,谷歌還結合了Imagen Video和Phenaki的優勢,推出了一種可以生成超長連貫視頻的新模式。
還有AudioLM這種音頻模型,不需要文字和樂譜的訓練,只需要聽音頻樣本就可以持續生成填充音樂。
說完谷歌官方公布的這些新技術,我們再來看看谷歌科學家自己是怎么說的。
谷歌科學家眼中的新進展
除了產品層面,今年谷歌AI研究還有哪些新進展。
谷歌大腦的工程師周在推特上分享了他的觀點:大模型學會了如何解釋答案,檢查答案,并將復雜的問題分解為子問題來解決。
這一切都始于谷歌今年1月發表的一篇論文思維鏈承諾引發大型語言模型中的推理。
正是在這篇論文中,Google首次提出了思維鏈線索的概念。
簡單來說,思維鏈提示是一種特殊的情境學習與標準提示只給出輸入輸出對的例子不同,思維鏈提示會增加一個額外的推理過程
這一步的目的是讓模型針對當前問題模仿生成自己的思維過程,最終提高生成結果的準確性。
該方法已在LaMDA—137B,GPT—3 175B和PaLM—540B三個大型語言模型中得到驗證與標準提示相比,新方法明顯提高了算術,常識和符號推理任務的準確性
而且伴隨著模型參數的增加,思維鏈提示的效果也呈指數級增加。
尤其是使用谷歌的超級語言模型PaLM—540B,在包括數學問題在內的多項推理基準測試中都達到了SOTA水平,甚至超過了使用驗證器進行微調的GPT—3。
很快,兩個月后,該小組繼續研究。
本文使用了與原文幾乎相同的數據集和設置主要的改進是提出了一個簡單的策略,叫做自洽
簡單來說,就像人在思考的時候會想出幾種不同的解決方案然后做出判斷一樣,自洽法會通過思維線索鏈從語言模型中采樣出一組不同的推理路徑,然后以多數投票選出答案,最后返回最自洽的答案。
這一步優化不僅意味著離模仿人類思維方式更近了一步,也顯著提升了思維鏈方法的性能。
最新進展是,為了解決由易到難的泛化問題,團隊提出了一種新穎的提示策略。
它將一個復雜的問題簡化為一系列子問題,然后依次求解這些子問題,從而通過對之前求解的子問題的解答來促進給定子問題的求解。
通過這種方式,谷歌正在訓練AI一步步接近人類的思維模式。
最后說了這么多,今年給你印象最深的Google AI研究是什么。
參考鏈接:
。鄭重聲明:此文內容為本網站轉載企業宣傳資訊,目的在于傳播更多信息,與本站立場無關。僅供讀者參考,并請自行核實相關內容。
2023年2月15日,湯臣倍健與美團買藥在北京舉辦了2023
2021年收入增長目標應能確保實現,2022年收入增長預計將
具體來看,一是簡化業務流程和材料,便利北京冬奧會相關區域內境
炒股就看金麒麟分析師研報,權威,專業,及時,全面,助您挖掘潛
,據索尼官方消息,新星粉,銀河紫,星光藍,三款全新配色Dua
,新氧數據顏究院發布《2021醫美行業白皮書》,白皮書顯示,