當(dāng)前位置:首頁 >  科技 >  互聯(lián)網(wǎng) >  正文

押注數(shù)字人,百度、科大訊飛“短兵相接”

 2023-07-05 15:29  來源: A5專欄   我來投稿 撤稿糾錯

  域名預(yù)訂/競價,好“米”不錯過

配圖來自Canva可畫

近兩年,小雀斑、柳夜熙、AYAYI等大量網(wǎng)紅數(shù)字人的相繼出現(xiàn),以及虛擬數(shù)字技術(shù)在《指環(huán)王》和《阿凡達(dá)》以及《刺殺小說家》等電影中的廣泛應(yīng)用,還有北京冬奧會期間數(shù)字人在手語解說、節(jié)目直播等眾多場合亮相,使得公眾對數(shù)字人的認(rèn)知上升到了一個新的臺階。

 

作為數(shù)字經(jīng)濟(jì)的重要環(huán)節(jié),數(shù)字人為數(shù)字經(jīng)濟(jì)的發(fā)展注入了新的動能。于是,各個行業(yè)企業(yè)便涌現(xiàn)出了多個玩家,紛紛基于已有的相關(guān)技術(shù)和業(yè)務(wù)基礎(chǔ),開始進(jìn)軍數(shù)字人賽道,數(shù)字人行業(yè)也由此迎來了一波新的發(fā)展熱潮。

 

數(shù)字人乘風(fēng)而起

 

隨著數(shù)字人在各行各業(yè)中的應(yīng)用越來越廣泛,國內(nèi)數(shù)字人市場規(guī)模也在持續(xù)穩(wěn)步增長。根據(jù)IDC在《中國AI數(shù)字人市場現(xiàn)狀與機(jī)會分析2022》報告中預(yù)計,到2023年中國AI數(shù)字人市場規(guī)模將達(dá)102.4億元。而數(shù)字人市場之所以將呈現(xiàn)高速增長的態(tài)勢,則與三大利好不無關(guān)系。

 

從政策層面來看,國家政策的大力支持,預(yù)示著數(shù)字人的前景一片大好。近年來,國內(nèi)虛擬現(xiàn)實相關(guān)產(chǎn)業(yè)備受外界關(guān)注,自2016年起,國家就發(fā)布了多項政策支持我國虛擬現(xiàn)實產(chǎn)業(yè)的發(fā)展,并將虛擬現(xiàn)實和增強(qiáng)現(xiàn)實與云計算、大數(shù)據(jù)、物聯(lián)網(wǎng)、工業(yè)互聯(lián)網(wǎng)、區(qū)塊鏈、人工智能一起列為了數(shù)字經(jīng)濟(jì)重點產(chǎn)業(yè)。而虛擬數(shù)字人作為虛擬現(xiàn)實產(chǎn)業(yè)重要的應(yīng)用之一,自然也有望享受到政策利好所帶來的紅利釋放期。

 

從技術(shù)層面來看,數(shù)字技術(shù)的融合發(fā)展,驅(qū)動了數(shù)字人進(jìn)入發(fā)展快車道。其實數(shù)字人出現(xiàn)的時間并不算晚,只是受技術(shù)應(yīng)用水平的限制,早期的數(shù)字人制作周期長且成本高。而近幾年,隨著CG、語音合成、深度學(xué)習(xí)算法、自然語言處理等技術(shù)的進(jìn)步,數(shù)字人各環(huán)節(jié)制作周期大大縮短、制作成本明顯降低,數(shù)字人制作也走向了智能化。堅實的技術(shù)基礎(chǔ),不僅創(chuàng)新了數(shù)字人行業(yè)的發(fā)展應(yīng)用,更是加速了數(shù)字人場景化的應(yīng)用落地。

 

從環(huán)境層面來看,AIGC技術(shù)的逐漸成熟,助力了數(shù)字人行業(yè)規(guī)模的拓展。數(shù)字人雖然最初多應(yīng)用于影視、游戲等行業(yè),但隨后應(yīng)用場景將會不斷拓展。只不過,越復(fù)雜的環(huán)境對數(shù)字人的信息處理能力、即時互動能力,以及表達(dá)能力等都有著更高的要求。而在AIGC的賦能下,數(shù)字人內(nèi)容生產(chǎn)流程將有望得到創(chuàng)新,可助力數(shù)字人廣泛與各行業(yè)領(lǐng)域相結(jié)合,為數(shù)字人描繪出了極大的創(chuàng)作及交互想象空間。

 

在政策、技術(shù)、環(huán)境的多輪驅(qū)動下,數(shù)字人應(yīng)用場景將持續(xù)得到拓展與深化。而隨著數(shù)字人行業(yè)進(jìn)入高速發(fā)展期,國內(nèi)也已出現(xiàn)了諸多相當(dāng)有競爭力的玩家,這其中,以百度為代表的綜合類互聯(lián)網(wǎng)技術(shù)廠商,以及以科大訊飛代表的專長類AI廠商的表現(xiàn)最為突出,優(yōu)勢也最為明顯。

 

百度“雙輪驅(qū)動”

 

目前來看,數(shù)字人雖然已經(jīng)應(yīng)用于多個領(lǐng)域,但當(dāng)前市場上大多的數(shù)字人產(chǎn)品精度依舊較低,而百度不僅上線了具備較強(qiáng)的視覺感知和動作控制能力,能夠通過手勢、語音等方式與用戶進(jìn)行互動的虛擬數(shù)字人,還搭建了百度智能云曦靈智能數(shù)字人平臺,提供虛擬形象智能交互解決方案,而這些產(chǎn)品的生成,都源于百度為數(shù)字人相關(guān)開發(fā)提供了絕佳的土壤。

 

一方面,百度在AI技術(shù)上的領(lǐng)先優(yōu)勢,能夠高效率、高質(zhì)量地推動其數(shù)字人技術(shù)的迭代升級。眾所周知,數(shù)字人的發(fā)展離不開計算機(jī)視覺、智能語音、自然語言處理等AI技術(shù)的支持,而作為國內(nèi)唯一一家既有視覺能力,又有語音、語義相關(guān)包括計算機(jī)圖形學(xué)自動生成全鏈路AI能力平臺型的公司,百度已經(jīng)積累了大量全棧AI能力,而這無疑是其數(shù)字人成功落地的實力與底氣。

 

另一方面,百度標(biāo)準(zhǔn)化、平臺化的優(yōu)勢,可以有效降低運營門檻,助其數(shù)字人實現(xiàn)廣泛應(yīng)用。想要實現(xiàn)“人均一個”數(shù)字人,產(chǎn)品標(biāo)準(zhǔn)化、平臺化必不可少。得益于百度在視覺、NLP、語音交互等底層全棧AI技術(shù)優(yōu)勢的長期積累,以及PLATO百億參數(shù)對話大模型,百度智能云已經(jīng)將這一能力平臺化、標(biāo)準(zhǔn)化,這不僅使其部署成本更低,周期更短,還可以做到一次部署、一次建設(shè),并在多個場景下形成虛擬數(shù)字人能力,實現(xiàn)端到端軟硬一體的商業(yè)應(yīng)用。

 

百度憑借無可比擬的AI能力,加之在標(biāo)準(zhǔn)化、平臺化中服務(wù)穩(wěn)定、成本低廉等特點,在數(shù)字人領(lǐng)域先發(fā)制人,在產(chǎn)品力、市場上走在了行業(yè)前列。據(jù)了解,百度智能數(shù)字人平臺是世界上首個在線語音交互注意力模型,實現(xiàn)與數(shù)字人自然暢通交流,高準(zhǔn)確度的音畫同步,逐字口型準(zhǔn)確率>98.5%。另外,目前百度終端虛擬人產(chǎn)品,也已經(jīng)以智能客服的形象,成功落地在了深圳、重慶、鄭州等多個城市的各大地鐵站,全天候為來往的乘客提供最便利的智能咨詢服務(wù)。

 

科大訊飛“三線出擊”

 

數(shù)字人已經(jīng)成為多家廠商發(fā)力的重點,凡是進(jìn)入的玩家都在機(jī)器視覺、語音交互和自然語言處理等方面有著或多或少的技術(shù)積累,而盡管國內(nèi)諸多互聯(lián)網(wǎng)大廠和科技巨頭都瞄準(zhǔn)了數(shù)字人賽道,但作為亞太地區(qū)知名的智能語音和人工智能上市企業(yè),科大訊飛同樣在推動數(shù)字人產(chǎn)品和場景應(yīng)用落地上,建立起了自己的優(yōu)勢。

 

一是,科大訊飛所具有的豐富的技能和問答知識儲備,可以讓其數(shù)字人變得更加聰慧智能。一直以來,科大訊飛都在致力于讓機(jī)器“能聽會說,能理解會思考”,其開發(fā)的星火大模型不僅在開放式知識問答上取得了突破,其多輪對話、邏輯和數(shù)學(xué)能力也有所升級。而科大訊飛語言理解、知識問答、邏輯推理等各項能力的持續(xù)提升,能夠使其數(shù)字人準(zhǔn)確地理解用戶問題,并給出自然、準(zhǔn)確的回答,為用戶帶來更為豐富的使用體驗。

 

二是,科大訊飛在智能語音技術(shù)方面的深厚積淀,可以為其數(shù)字人的落地提供全鏈路保障??拼笥嶏w自成立以來,就一直從事著智能語音、自然語言理解、計算機(jī)視覺等核心技術(shù)的研究,并且其在語音、圖像、自然語言理解、機(jī)器認(rèn)知推理能力、多語種多模態(tài)人機(jī)交互等方面的技術(shù)和產(chǎn)業(yè)化應(yīng)用已具有業(yè)界領(lǐng)先水平。得益于此,科大訊飛的數(shù)字人也就能得到語音識別、語義理解、語音合成、形象驅(qū)動、視頻渲染服務(wù)的全鏈路保障。

 

三是,科大訊飛專屬的數(shù)字人定制能力,有助其在眾多廠商中形成差異化優(yōu)勢??拼笥嶏w可以根據(jù)客戶要求,在客戶的不同業(yè)務(wù)場景下進(jìn)行AI虛擬人賦能,為客戶提供一站式、定制化AI虛擬人服務(wù)。比如,在服務(wù)部署上,可以靈活采用公有云或私有云的部署方案,保障交互服務(wù)的安全穩(wěn)定;在形象聲音上,可以根據(jù)客戶音色、風(fēng)格的需求靈活定制專屬的個性化語音庫;在虛擬人形象上,可以支持2D真人形象,從而為客戶定制專有IP形象。

 

仍需負(fù)重前行

 

在數(shù)字時代,數(shù)字人已經(jīng)開始在各個企業(yè)中扮演關(guān)鍵角色。然而對于數(shù)字人企業(yè)而言,打通產(chǎn)業(yè)鏈各環(huán)節(jié)、修煉技術(shù)“內(nèi)功”,才是打造競爭優(yōu)勢、強(qiáng)化競爭壁壘的關(guān)鍵。因此,即便是國內(nèi)數(shù)字人發(fā)展較為成熟的公司,已經(jīng)在客戶積累、技術(shù)實力、銷售渠道、資金供給等方面具備了一定積累,但由于數(shù)字人行業(yè)天花板依舊較高,想要維持長期和衍生發(fā)展并不容易。

 

一方面,國內(nèi)數(shù)字人尚處于起步階段,距離商業(yè)化規(guī)模推廣仍有一定距離。盡管國內(nèi)諸多企業(yè)的數(shù)字人已經(jīng)實現(xiàn)了場景化應(yīng)用,但就整體而言,我國數(shù)字人行業(yè)發(fā)展仍處于起步階段,不僅尚未跑出一個覆蓋全產(chǎn)業(yè)鏈的數(shù)字人企業(yè),大多數(shù)企業(yè)在數(shù)字人情緒感知、語義理解、情感連接等方面仍有所欠缺。另外,國內(nèi)各家數(shù)字人在細(xì)分市場上的產(chǎn)品也都還仍處于試驗可行性的階段,大規(guī)模商業(yè)化暫時還難以實現(xiàn)。

 

另一方面,海外巨頭的數(shù)字人優(yōu)勢明顯,國內(nèi)企業(yè)想要追趕還需更加努力。國內(nèi)領(lǐng)先企業(yè)的數(shù)字人產(chǎn)品雖然已經(jīng)頗具特色,但國內(nèi)企業(yè)更側(cè)重AI技術(shù)的開發(fā)與內(nèi)容應(yīng)用,因此數(shù)字人產(chǎn)品大多探索的是其在社交活動、新聞媒體、文旅等領(lǐng)域的應(yīng)用。而海外巨頭多聚焦于數(shù)字人的基礎(chǔ)建設(shè),技術(shù)優(yōu)勢較為明顯。比如英偉達(dá)、Unity等均基于自身技術(shù)優(yōu)勢向下游生產(chǎn)技術(shù)服務(wù)平臺延伸,相較于國內(nèi),其技術(shù)壁壘就更為深厚。

 

目前來看,國內(nèi)以百度、科大訊飛為代表的科技企業(yè)在數(shù)字人上的探索雖然還有一定難度,但值得注意的是,在各個大廠的不斷發(fā)力,以及人工智能技術(shù)的大力加持下,數(shù)字人的制作運營效率有望得到持續(xù)優(yōu)化,其應(yīng)用價值也將得到不斷釋放。而隨著百度、科大訊飛不遺余力地加速數(shù)字人的進(jìn)程,其數(shù)字人的未來也將會非常值得期待。

申請創(chuàng)業(yè)報道,分享創(chuàng)業(yè)好點子。點擊此處,共同探討創(chuàng)業(yè)新機(jī)遇!

相關(guān)標(biāo)簽
數(shù)字人
科大訊飛
百度

相關(guān)文章

熱門排行

信息推薦