Meta Platforms今天公開了NLLB—200的系統代碼NLLB—200是由Meta開發的人工智能系統,可以翻譯200種語言的文本
Meta還發布了一套工具,幫助研究人員更容易地將NLLB—200應用于軟件項目。
根據Meta的說法,NLLB—200可以理解的200種語言中有許多都沒有得到其他人工智能翻譯系統的良好支持目前,廣泛使用的翻譯工具支持的非洲語言不到25種,而NLLB—200支持的非洲語言多達55種
Meta,翻譯準確性是NLLB—200優于其他工具的另一個方面Meta采用BLEU評測系統的準確度標準,BLEU是一種用來衡量機器翻譯文本質量的算法據Meta統計,NLLB 200的BLEU評分比以前提高了44%
Meta的CEO馬克·扎克伯格說:我們剛剛開放了一個自研的AI模型,可以翻譯200種不同語言mdashmdash當前的翻譯系統不支持其中的許多語言我們稱這個項目為不讓一種語言掉隊,我們使用的人工智能建模技術正在對全球數十億人使用的語言進行高質量的翻譯
NLLB—200有超過500億個參數,這些配置決定了人工智能系統處理數據的方式人工智能系統的參數越多,精度越高
NLB—200擁有如此大量的參數,這并不是它能夠高精度支持200種語言的唯一因素,因為NLLB—200系統還借鑒了Meta工程師開發的許多其他AI創新。
使用Meta開發的LASER Toolkit來支持機器學習相關的研究使用這個工具包,研究人員可以訓練神經網絡用一種語言執行特定的任務,然后相對容易地將神經網絡適配到其他語言,這對翻譯非常有用
LASER的原始版本包括一個名為LSTM的神經網絡,這是一個專門的組件,可以將文本轉換為人工智能系統可以理解的數學表示這種數學表示有助于生成更準確的翻譯結果在LASER3中,Meta用Transformer代替了LSTM神經網絡前者是一種高級的自然語言處理模型,可以更有效地執行相同的任務
梅塔還使用了其他幾種方法來提高NLLB—200的功能例如,Meta升級了收集訓練數據的系統,并對AI訓練工作流程進行了更改
用Meta開發的研究超級集群超級計算機訓練NLLB—200Meta在今年1月首次推出Research SuperCluster時表示,該系統配備了6080顆英偉達最新的A100數據中心GPU,最終將升級到16000顆GPU
Meta計劃使用NLLB—200在臉書,Instagram和其他平臺上提供更好的自動翻譯功能預計該系統每天將支持超過250億次翻譯
在努力在內部推廣NLLB—200的同時,Meta還計劃幫助其他商業組織將該系統應用到他們自己的軟件項目中。
除了NLLB—200,Meta還開放了可用于訓練AI的源代碼,以及一個名為FLORES—200的數據集,用于評估翻譯的準確性Meta將提供高達20萬美元,幫助非營利組織采用NLLB—200此外,Meta將與維基媒體基金會合作,將自動翻譯技術應用于維基百科的文章
鄭重聲明:此文內容為本網站轉載企業宣傳資訊,目的在于傳播更多信息,與本站立場無關。僅供讀者參考,并請自行核實相關內容。
2023年2月15日,湯臣倍健與美團買藥在北京舉辦了2023
2021年收入增長目標應能確保實現,2022年收入增長預計將
具體來看,一是簡化業務流程和材料,便利北京冬奧會相關區域內境
炒股就看金麒麟分析師研報,權威,專業,及時,全面,助您挖掘潛
,據索尼官方消息,新星粉,銀河紫,星光藍,三款全新配色Dua
,新氧數據顏究院發布《2021醫美行業白皮書》,白皮書顯示,