亚洲三级在线播放_国产精品亚洲二区在线_精品国产电影久久久久_免费popnhub国产在线视频 - 美女被艹网站

金財晚報

金財晚報

當前位置:首頁>民生消費>

GIRAFFE—ControllableImageGeneration

來源:TechWeb 作者:蘇小糖 發布時間:2021-12-31 14:48   閱讀量:4847   

2021年是人工智能繼續突飛猛進的一年最近幾天,Github上有人總結出了今年最有趣,最驚艷的38篇關于AI和機器學習論文,值得收藏

GIRAFFE—ControllableImageGeneration

1,Zero—Shot Text—to—Image Generation

文本到圖像的生成傳統上側重于為固定數據集的訓練尋找更好的建模假設本文描述了一種基于Transformer的簡單方法來完成此任務,將文本和圖像標記自回歸建模為單個數據流憑借足夠的數據和規模,當以零樣本方式進行評估時,我們的方法與以前的特定領域模型相比具有競爭力

2,VOGUE: Try—On by StyleGAN Interpolation Optimization

給定目標人物的圖像和穿著服裝的另一個人的圖像,我們會自動生成給定服裝中的目標人物我們方法的核心是姿勢條件 StyleGAN2 潛在空間插值,它無縫地結合了每個圖像的興趣區域,即體型,頭發和膚色來自目標人物,而帶有褶皺的服裝 ,材料屬性和形狀來自服裝圖像

3,Taming Transformers for High—Resolution Image Synthesis

本文將 GAN 和卷積方法的效率與Transformer的表達能力相結合,為語義引導的高質量圖像合成提供了一種強大且省時的方法。

4,Thinking Fast And Slow in AI

本文從人類能力中汲取靈感,提出了走向更通用和更值得信賴的人工智能和人工智能研究社區的 10 個問題。

5,Automatic detection and quantification of floating marine macro—litter in aerial images

來自巴塞羅那大學的研究人員開發了一種基于深度學習的算法,能夠從航拍圖像中檢測和量化漂浮的垃圾他們還制作了一個面向網絡的應用程序,允許用戶在海面圖像中識別這些垃圾

6,ShaRF: Shape—conditioned Radiance Fields from a Single View

試想一下,如果只拍攝對象的照片并將其以 3D 格式插入到您正在創建的電影或視頻游戲中,或者插入到 3D 場景中進行插圖,那該有多酷。

7,Generative Adversarial Transformers

本文利用了強大的 StyleGAN2 架構中Transformer的注意力機制,使其更加強大!

8,We Asked Artificial Intelligence to Create Dating Profiles. Would You Swipe Right。

你會在 AI 的個人資料頁面上仔細查看嗎你能區分真人與機器嗎這項研究揭示了在約會應用程序上使用AI,會發生什么事情

9,Swin Transformer: Hierarchical Vision Transformer using Shifted Windows

Transformers 會取代計算機視覺中的 CNN 嗎在不到 5 分鐘的時間內,你就可以通過這篇關于 Swin Transformer 的新論文,了解如何將 Transformer 架構應用于計算機視覺任務

10,IMAGE GANS MEET DIFFERENTIABLE RENDERING FOR INVERSE GRAPHICS AND INTERPRETABLE 3D NEURAL RENDERING

本文提出了名為 GANverse3D 的模型,只需要一張圖像,就可以創建可以自定義和動畫的 3D 圖像。

11,Deep nets: What have they ever done for vision。

本文將公開分享有關用于視覺應用的深度網絡,它的成功之處,以及我們必須解決的局限性等一切內容。

12,Infinite Nature: Perpetual View Generation of Natural Scenes from a Single Image

13,Portable, Self—Contained Neuroprosthetic Hand with Deep Learning—Based Finger Control

本文提出了一種由人工智能驅動的神經接口,截肢患者可以以栩栩如生的靈巧和直覺來控制神經假肢。他們支持全球經濟中的普通人,并以這種方式致力于其業務的長期健康發展,包括提高一線工人的工資和福利,為小農經濟服務,以及向中低收入國家分發新冠肺炎疫苗。

14,Total Relighting: Learning to Relight Portraits for Background Replacement

15,LASR: Learning Articulated Shape Reconstruction from a Monocular Video

本文提出一種方法,可以僅以短視頻作為輸入,生成人類或動物移動的 3D 模型事實上,模型實際上明白,生成的目標是一個奇怪的形狀,可以移動,但仍然需要和原視頻保持附著,因為這仍然是「一個目標」,而不僅僅是多目標的集合

16,Enhancing Photorealism Enhancement

本文中,英特爾的研究人員提出一個 AI模型,可實時應用于視頻游戲,并讓每一幀圖像看起來更自然。

17,DefakeHop: A Light—Weight High—Performance Deepfake Detector

如何在 2021 年準確識別Deepfake假視頻這篇新論文可能會提供答案可能是「再次使用人工智能」以后,「眼見為實」可能很快就會變成「AI說真才是真」

18,High—Resolution Photorealistic Image Translation in Real—Time: A Laplacian Pyramid Translation Network

本文提出一種基于機器學習的新方法,實時將任何樣式的圖像翻譯成指定風格的 4K 圖像!

19,Barbershop: GAN—based Image Compositing using Segmentation Masks

這篇文章本身并不是一項新技術,而是關于 GAN 的一個令人興奮的新應用這個 AI 可以改變你的發型,看看改變前后的對比吧

20,TextStyleBrush: Transfer of text aesthetics from a single example

2021年,在異國旅行的你走進一家餐館,面對看不懂的菜單,你甚至不需要打開谷歌翻譯,只要簡單地使用 Facebook AI 的這篇文章中的新模型,就可以翻譯菜單圖像中的每個文字。

21,Animating Pictures with Eulerian Motion Fields

22,CVPR 2021最佳論文獎: GIRAFFE — Controllable Image Generation

本文使用修改后的 GAN 架構,可以在不影響背景或其他目標的情況下移動圖像中的目標。《103010》雜志評論稱,今年上榜的許多公司都在努力扭轉新冠肺炎疫情帶來的社會問題。

23,GitHub Copilot amp, Codex: Evaluating Large Language Models Trained on Code

OpenAI 的這個新模型,可以從單詞生成代碼。

24,Apple: Recognizing People in Photos Through Private On—Device Machine Learning

蘋果使用在您的設備上多種基于機器學習的算法,讓用戶在 iOS 15 上實現準確規劃和組織自己的圖像和視頻。

25,Image Synthesis and Editing with Stochastic Differential Equations

是時候告別復雜的 GAN 和用于圖像生成的Transformer架構了!來自斯坦福大學和卡內基梅隆大學的研究人員可以從任何基于用戶的輸入中生成新圖像即使是毫無藝術基礎的人,現在也可以從草圖中生成漂亮的圖像

26,Sketch Your Own GAN

通過按照草圖生成圖像,讓每個人都可以更輕松地進行 GAN 訓練!事實上,借助這種新方法,您可以根據最簡單的知識類型來控制 GAN 的輸出:手繪草圖。

27,Tesla's Autopilot Explained

本文中,特斯拉人工智能總監安德烈middot,卡帕西等人展示了特斯拉的自動駕駛系統是如何通過他們的八個攝像頭采集圖像,實現道路上導航。

28,Styleclip: Text—driven manipulation of StyleGAN imagery

AI 可以生成圖像,通過反復試驗,研究人員可以按照特定的樣式控制生成結果。。現在,有了這個新模型,只使用文本就能做到這一點!

29,Time Lens: Event—based Video Frame Interpolation

TimeLens 模型可以理解視頻幀之間的粒子運動,以人眼無法捕捉的速度重建視頻事實上,本文中的模型效果達到了目前智能手機都無法達到的效果

30,Diverse Generation from a Single Video Made Possible

31,Skillful Precipitation Nowcasting using Deep Generative Models of Radar

DeepMind 剛剛發布了一個生成模型,能夠在 89% 的情況下優于廣泛使用的臨近預報方法,其準確性和實用性通過了 50 多位氣象學家的評估!這個模型專注于預測未來 2 小時內的降水,實現效果出奇地好。

32,The Cocktail Fork Problem: Three—Stem Audio Separation for Real—World Soundtracks

你是否曾在收看視頻或電視節目時完全聽不見演員的聲音,或者音樂太大聲嗯,這個問題可能永遠不會再發生了三菱和印第安納大學剛剛發布了一個新模型和一個新數據集,用于識別并處理關于視頻配樂聲音的問題

33,ADOP: Approximate Differentiable One—Pixel Point Rendering

想象一下,從拍攝的一堆照片中生成一個 3D 模型或一段簡單流暢的視頻現在,這個目標可以實現了

34,CLIPDraw: Coupling Content and Style in Text—to—Drawing Synthesis

35,SwinIR: Image restoration using swin transformer

您是否曾經拍下過非常喜歡的圖像,但現在只有一張小圖了如果能把它的清晰度提高四到八倍該有多好本文中的方法可以將圖像的分辨率提高4倍,使其看起來更加平滑而且可以在幾秒鐘內自動完成,幾乎適用于任何圖像

36,EditGAN: High—Precision Semantic Image Editing

37,CityNeRF: Building NeRF at City Scale

本文中的模型稱為 CityNeRF,是從 NeRF 發展而來的NeRF 是最早使用輻射場和機器學習從圖像構建 3D 模型的模型之一但效率不高,而且只適用于單一規模本文中,CityNeRF可同時應用于衛星和地面圖像,為任何視點生成各種 3D 模型比例

38,ClipCap: CLIP Prefix for Image Captioning

鄭重聲明:此文內容為本網站轉載企業宣傳資訊,目的在于傳播更多信息,與本站立場無關。僅供讀者參考,并請自行核實相關內容。

mangren

財經視界

財經圖文

熱門推薦

金財晚報僅作為用戶獲取信息之目的,并不構成投資建議。市場有風險 投資需謹慎。

網站地圖

Copyright 2018- 金財晚報 All Rights Reserved 聯系我們: 備案號:蜀ICP備13010463號