阿里云通義聽悟新增自動提取PPT等三大功能

8月2日消息,阿里云通義聽悟上線三大新功能,包括國內音視頻AI領域首創的視頻自動提取PPT,以及瀏覽器插件、釘釘和微信小程序。
截自通義大模型官網
今年6月,阿里云首次宣布通義聽悟開放公測。此次升級,在原有實時記錄、音視頻文件轉寫、全文概要、章節速覽等功能之上,新增“提取PPT”功能。該功能通過引入視覺AI算法,自動將PPT講解視頻分割為演示文稿,并對每頁PPT進行要點總結,形成一份圖文并茂的大綱,解決培訓、網課學習等場景“求PPT難”的問題。
通義聽悟還增加了瀏覽器插件和移動端的支持。用戶開會、上網課、看直播、看視頻時,Chrome和Edge瀏覽器插件功能可全程錄制,并實時生成雙語字幕,幫助用戶更輕松地瀏覽視頻內容。
截自通義大模型官網
在移動端,通義聽悟釘釘和微信小程序不僅支持PC端的基礎功能,還可以一鍵轉寫手機和聊天記錄的音視頻文件。
本次新功能上線期間,阿里云繼續聯合各大平臺和社區推出定制口令碼,用戶根據口令碼可隨機抽取20h、30h、66h、88h、100h的免費轉寫時長。通義聽悟集成了阿里云的語音、語言和視覺AI技術,未來還將陸續上線適用于更多場景的新功能。
據悉,阿里云自2019年啟動大模型研發以來,通義大模型逐步從單一模態真正升級為多模態大模型。今年4月,阿里云正式推出大語言模型“通義千問”,它能夠響應人類以自然語言提出的指令,完成回答問題、創作文字、編寫代碼、角色扮演對話等各項任務。
在7月舉行的2023世界人工智能大會期間,阿里云宣布推出通義大模型家族新成員通義萬相,用戶可以在通義萬相中輸入提示詞,以輸出相應圖像。除文生圖以外,通義萬相也推出了包括風格遷移、相似圖生成等功能。
截自通義大模型官網
阿里云智能集團首席技術官周靖人在2023世界人工智能大會透露,通義千問已有累計超30的申請用戶,超過100家深度共創企業,而通義聽悟發布首月已有36萬用戶。
