?阿里“AI神器”通義聽悟重磅升級:超長視頻自由問,還會做思維導(dǎo)圖

中國經(jīng)濟(jì)周刊-經(jīng)濟(jì)網(wǎng)訊 3月19日,阿里大模型產(chǎn)品“通義聽悟”發(fā)布多項新功能。音視頻問答助手“小悟”上線,在業(yè)界首次實現(xiàn)單記錄、跨記錄、多語言自由問,支持對單個最長6小時、一次性上百條音視頻的內(nèi)容理解問答,用戶可對超長音視頻隨心提問,讓AI總結(jié)任意知識點。

圖1.png

此外,針對學(xué)習(xí)科研場景對AI工具的強烈需求,通義聽悟推出“高校公益計劃”,向所有中國大陸高校師生直接贈送價值數(shù)千元的500小時音視頻轉(zhuǎn)寫時長。

音視頻承載了密集的信息內(nèi)容,但因涉及多模態(tài)理解、自然語言處理、搜索等多項復(fù)雜技術(shù),長期以來內(nèi)容查找難、回顧難、提煉難。阿里通義聽悟產(chǎn)品負(fù)責(zé)人楊帆介紹,通義聽悟為這一需求而生。“作為一款工作學(xué)習(xí)AI助手,通義聽悟希望讓高知識附加值的音視頻被輕松閱讀、整理和分享?!?/p>

通義聽悟接入通義千問大模型,融合了十多項AI功能,包括轉(zhuǎn)寫、翻譯、角色分離、全文摘要、章節(jié)速覽、發(fā)言總結(jié)、PPT提取等,并支持標(biāo)重點、記筆記,被許多用戶稱為“寶藏AI工具”。

通義聽悟本次升級上新了六大功能點。最重磅的是音視頻問答助手“小悟”,關(guān)鍵信息直接“問”出來。小悟通過多語言Query處理、長篇章文本理解、指令演化框架優(yōu)化及檢索增強生成算法,在業(yè)內(nèi)首次實現(xiàn)對超長音視頻的單記錄、跨記錄、多語言自由問答,支持內(nèi)容問答的音視頻時長和文件數(shù)均突破業(yè)界上限。

圖2.png

用戶不僅可在單一記錄頁呼喚小悟,對最高6小時、6G大小的音視頻提問任何相關(guān)話題,或直接小悟要求整理金句、梳理結(jié)論、寫會議紀(jì)要;更可在首頁針對用戶所有記錄提問,支持一次性掃描理解上百條音視頻內(nèi)容;也可花式對英文視頻用中文提問,小悟?qū)⒅苯咏o出中文回答,省去翻譯。作為一個“懂你”的AI,小悟還會智能推薦問題。

針對用戶需求,通義聽悟還上線了一鍵AI改寫、思維導(dǎo)圖生成等新能力。例如,一鍵AI改寫,將口語轉(zhuǎn)為書面表達(dá),尤其適合整理采訪;思維導(dǎo)圖自動生成,最多支持五級xmind腦圖,適合播客摘要。

產(chǎn)品細(xì)節(jié)體驗也進(jìn)一步升級,包括筆記支持一鍵插入視頻時間戳及截圖、音視頻文件語種自動識別等。

作為國內(nèi)首個開放公測的大模型產(chǎn)品,去年6月發(fā)布以來,通義聽悟累計已有上百萬用戶,包括學(xué)生、老師、白領(lǐng)、記者、律師、金融分析師等群體,活躍用戶日均轉(zhuǎn)寫音視頻3次以上,平臺每天處理字符數(shù)約20億字。

編輯:孫冰

頂部