Gartner報告:阿里云語言AI領域排名第二

7月7日消息,近日,國際權(quán)威研究機構(gòu)Gartner公布《云AI開發(fā)者服務關鍵能力報告》,報告顯示,在語言AI領域,阿里云排名第二。
據(jù)了解,Gartner報告圍繞語言AI、計算機視覺、機器學習平臺三大維度,對全球云AI服務廠商進行評估排名。
其中,語言AI領域的評分由語音識別、自然語言生成/語音合成、語言理解/處理、機器翻譯、情感分析、文本分析六項能力組成。最終,阿里總分位居第二。
Gartner表示,到2025年,70%的新應用將集成AI模型。云AI服務可有效降低AI應用的開發(fā)門檻。
根據(jù)Gartner報告,阿里云在該領域為開發(fā)者提供了1600多種模型服務,在大規(guī)模預訓練語言模型的實力強勁,并在數(shù)字人、手語翻譯等領域取得了一系列進展。
當前,語言技術(shù)是人工智能的基礎技術(shù),其包含語音和語義技術(shù)。阿里達摩院在該領域已有300多篇論文被國際頂會收錄,并在技術(shù)和應用上實現(xiàn)了多項突破。
在語音技術(shù)方面,阿里達摩院基于自研SAN-M網(wǎng)絡結(jié)構(gòu)和SCAMA流式端到端語音識別框架構(gòu)建的系統(tǒng),可滿足不同場景對延時和準確率的要求,在提升計算效率、降低服務成本的同時,將高難度場景中的語音識別錯誤率降低近三成。
此外,阿里達摩院新一代語音合成技術(shù)SAMBERT在情感、韻律、音質(zhì)等多個維度優(yōu)化建模,可生成生動、富有表現(xiàn)力的語音。
據(jù)悉,2021年6月,北京首都機場線、大興機場線七大地鐵站點已全線開通語音購票。借助阿里達摩院研發(fā)的智能語音購票技術(shù),乘客對著售票機說出模糊目的地,AI即可自動確定附近地鐵站,并快速規(guī)劃最優(yōu)換乘方案。乘客選站所需時間,從平均15秒下降至1.6秒。
在語義技術(shù)方面,阿里達摩院作為最早投入預訓練語言模型研究的團隊之一,在阿里云的基礎設施之上,研發(fā)了深度語言大模型體系AliceMind。
據(jù)介紹,AliceMind包括通用預訓練模型StructBERT、多語言預訓練模型VECO、超大中文預訓練模型PLUG等,具備閱讀、寫作、翻譯、問答、搜索、摘要生成、對話等多種能力,先后斬獲35個自然語言處理領域冠軍,該技術(shù)已面向全球開發(fā)者開源。
2021年8月,在國際權(quán)威機器視覺問答榜單VQA Leaderboard上,AliceMind以81.26%的準確率創(chuàng)造了新紀錄,讓AI在“讀圖會意”上首次超越人類基準線80.83%。
目前,這項研究成果已經(jīng)逐步應用于各行各業(yè)。例如,在跨境電商行業(yè),由于國貨出海過程中,國內(nèi)消費者對商品的昵稱“寶貝”直譯為“baby”,這會造成國外消費者的困惑,對此,達摩院的機器翻譯技術(shù)可以通過理解語境,自動將其調(diào)整為類似“product”等符合語境的詞語。
在阿里巴巴國際站,達摩院機器翻譯能提供214種語言的互譯服務,每天為國內(nèi)200萬中小商家翻譯上億文字,助力國貨走向全世界。
據(jù)央視財經(jīng)報道,山東省濟南市北王莊村村支書帶領村民開設地墊廠,并借助阿里平臺的智能翻譯,實現(xiàn)了與各國買家的無障礙溝通,2021年該工廠實現(xiàn)了2400萬元的外貿(mào)訂單,為村集體增收700多萬,2022年村民每人獲收入盈余分配4000元。
