行業(yè)資訊
AI虛擬主播“上新” 性格與角色可按需定制
發(fā)表日期:2022年05月18日“大家好,歡迎來到科大訊飛官方直播間,我是你們的主播茜茜。”
“我是茜茜的妹妹西西,別忘記點(diǎn)個(gè)‘關(guān)注’哦,今天晚上福利可是很多的?!?/p>
……
5月15日,真人主播茜茜牽手“孿生妹妹”亮相科大訊飛抖音直播間。這對“雙胞胎主播”雖然是樣貌相同的“姐妹花”,但西西借助科大訊飛新推出的“AI虛擬人直播系統(tǒng)”,不僅復(fù)刻了真人主播茜茜的外在,還賦予了其驅(qū)動(dòng)的能力,從而能夠?qū)崿F(xiàn)虛擬主播實(shí)時(shí)直播。
AI虛擬主播性格可定制、角色能多選
當(dāng)下,越來越多的AI虛擬主播走進(jìn)了大眾視野,在直播間、短視頻平臺等頻頻“出道”,憑借多維度、全感官、沉浸式的交互體驗(yàn),成為時(shí)下的“主播熱選”,集“萬千寵愛于一身”。
“科大訊飛AI虛擬主播依托語音識別、人臉建模、口唇預(yù)測、音頻驅(qū)動(dòng)等自主關(guān)鍵技術(shù),支持用戶通過文本或者語音輸入驅(qū)動(dòng)虛擬人進(jìn)行直播,從而實(shí)現(xiàn)智能驅(qū)動(dòng),快速便捷地進(jìn)行虛擬直播?!笨拼笥嶏w研究院執(zhí)行院長劉聰告訴科技日報(bào)記者。
劉聰表示,科大訊飛基于大數(shù)據(jù)多模態(tài)預(yù)訓(xùn)練的語種及說話人無關(guān)的口唇驅(qū)動(dòng)框架,在保證高真實(shí)度的口唇合成效果的同時(shí),還可以實(shí)現(xiàn)不同類型語音,包括不同語種、方言、音色的口唇驅(qū)動(dòng),讓虛擬主播無懼時(shí)空限制,哪怕是在臥室的床邊也能進(jìn)行直播,而且隨時(shí)可以與真人主播“無縫切換”,方式更加靈活、多變?!岸瓵I虛擬人直播系統(tǒng)’還擁有豐富的場景庫,可以根據(jù)直播內(nèi)容、虛擬人‘性格’等自由定制,打造專屬的虛擬人直播間?!眲⒙斦f。
據(jù)介紹,科大訊飛“AI虛擬人直播系統(tǒng)”擁有豐富的形象庫,不僅能根據(jù)受眾喜好、需求個(gè)性化選擇五官“捏臉”,創(chuàng)造一個(gè)全新的虛擬人,還可以根據(jù)不同場景賦予其相應(yīng)的形象氣質(zhì),或2D或3D、或半身或全身、或“鹽”或“甜”……“科大訊飛先進(jìn)的語音合成技術(shù),還能為虛擬人定制個(gè)性化語音庫,還原真人主播的聲音或是定制特色聲音。多語種技術(shù)更是讓AI虛擬主播既支持中英混合播報(bào),又支持日、韓、泰、越等多國語言,國際范兒十足?!眲⒙斦f。
可用于多個(gè)行業(yè),未來也能“走進(jìn)”尋常人家
記者在采訪中了解到,AI虛擬主播還可針對不同需求提供多端接口,并能面向多個(gè)場景提供垂直且完善的解決方案,可用于媒體、金融、文旅、政企等多行業(yè),提供音視頻內(nèi)容自動(dòng)化生產(chǎn)、智能交互的AI產(chǎn)品服務(wù),輔助實(shí)現(xiàn)自動(dòng)化、智能化的客戶價(jià)值。
其中,在媒體新聞場景中,可針對海量的音視頻內(nèi)容實(shí)現(xiàn)新聞內(nèi)容的音視頻生產(chǎn)自動(dòng)化。只要輸入文字即可“一站式”生產(chǎn)成品視頻,尤其是對重大、突發(fā)新聞等更新頻率較高的內(nèi)容播報(bào),能顯著提升效率。目前,央視新聞、人民日報(bào)數(shù)字傳播、合肥電視臺等媒體,與科大訊飛共同打造的AI虛擬主播均已“上崗”,表現(xiàn)出色。
“以‘虛擬人為載體的新一代人機(jī)交互’將快速進(jìn)化,我們需要在感知、理解、表達(dá)等多個(gè)維度持續(xù)取得技術(shù)突破,讓人機(jī)交互體驗(yàn)得到跨越式的提升。簡單來說,就是我們希望虛擬人越來越聰明,Ta們懂情感、有個(gè)性,能夠幫助人類協(xié)助我們的工作和生活?!眲⒙攲μ摂M人未來發(fā)展充滿信心。
劉聰認(rèn)為,從生產(chǎn)生活到奧運(yùn)賽場,人工智能早已不是沒有言語、冷冰冰的技術(shù),而是飽含溫情、賦能萬物的科技力量。基于AI虛擬人交互平臺底座研發(fā)的“AI虛擬人直播系統(tǒng)”,未來將會逐漸開放上百個(gè)虛擬形象、上千個(gè)音庫,提供多模感知、多維表達(dá)、情感貫穿、自主定制的特色服務(wù),讓虛擬主播的形象更真實(shí)、情感更靈動(dòng)、交互更智能。
AI如同水和電一樣已融入百姓生活。劉聰表示,未來通過將技術(shù)與產(chǎn)品和應(yīng)用場景深度融合,虛擬人也能“走進(jìn)”尋常人家,給人們的工作和生活帶來更便捷的服務(wù),成為人類的親密伙伴。
來源:科技日報(bào)