2024-11-13 01:08:37
交互型數(shù)字人根據(jù)驅(qū)動(dòng)方式的不同可分為智能驅(qū)動(dòng)型和真人驅(qū)動(dòng)型。
智能驅(qū)動(dòng)型數(shù)字人:通過(guò)智能系統(tǒng)自動(dòng)讀取并解析識(shí)別外界輸入信息,根據(jù)解析結(jié)果決策數(shù)字人后續(xù)的輸出文本,驅(qū)動(dòng)人物模型生成相應(yīng)的語(yǔ)音與動(dòng)作來(lái)使數(shù)字人跟用戶(hù)互動(dòng)。這種人物模型是預(yù)先通過(guò)AI技術(shù)訓(xùn)練得到,可通過(guò)文本驅(qū)動(dòng)生成語(yǔ)音和對(duì)應(yīng)動(dòng)畫(huà),業(yè)內(nèi)將此模型稱(chēng)為T(mén)TSA(TextToSpeech&Animation)人物模型。真人驅(qū)動(dòng)型數(shù)字人:真人根據(jù)視頻監(jiān)控系統(tǒng)傳來(lái)的用戶(hù)視頻,與用戶(hù)實(shí)時(shí)語(yǔ)音,同時(shí)通過(guò)動(dòng)作捕捉采集系統(tǒng)將真人的表情、動(dòng)作呈現(xiàn)在虛擬數(shù)字人形象上,從而與用戶(hù)進(jìn)行交互。
《重大領(lǐng)域交叉前沿方向2021》(2021年9月13日由浙江大學(xué)中國(guó)科教戰(zhàn)略研究院發(fā)布)認(rèn)為當(dāng)前以大數(shù)據(jù)、深度學(xué)習(xí)和算力為基礎(chǔ)的人工智能在語(yǔ)音識(shí)別、人臉識(shí)別等以模式識(shí)別為特點(diǎn)的技術(shù)應(yīng)用上已較為成熟,但對(duì)于需要知識(shí)、邏輯推理或領(lǐng)域遷移的復(fù)雜性任務(wù),人工智能系統(tǒng)的能力還遠(yuǎn)遠(yuǎn)不足。基于統(tǒng)計(jì)的深度學(xué)習(xí)注重關(guān)聯(lián)關(guān)系,缺少因果分析,使得人工智能系統(tǒng)的可解釋性差,處理動(dòng)態(tài)性和不確定性能力弱,難以與人類(lèi)自然交互,在一些敏感應(yīng)用中容易帶來(lái)**和倫理風(fēng)險(xiǎn)。類(lèi)腦智能、認(rèn)知智能、混合增強(qiáng)智能是重要發(fā)展方向