當(dāng)前位置:首頁 >  科技 >  IT業(yè)界 >  正文

Soul APP創(chuàng)始人張璐團隊在國際賽事中奪冠,推進AI社交技術(shù)創(chuàng)新

 2024-08-20 10:24  來源: 互聯(lián)網(wǎng)   我來投稿 撤稿糾錯

  阿里云優(yōu)惠券 先領(lǐng)券再下單

近日,在國際人工智能聯(lián)合會議(IJCAI)上舉辦的第二屆多模態(tài)情感識別挑戰(zhàn)賽(MER24)中,Soul APP創(chuàng)始人張璐領(lǐng)導(dǎo)的語音技術(shù)團隊(Soul AI)憑借優(yōu)秀的技術(shù)實力,在SEMI(半監(jiān)督學(xué)習(xí))賽道中脫穎而出,獲得第一名。

MER24由來自清華大學(xué)、中國科學(xué)院自動化研究所、帝國理工學(xué)院等高校的多位專家學(xué)者聯(lián)合舉辦,吸引了近百支來自知名高校、科技企業(yè)的隊伍參賽。MER24共設(shè)置SEMI(半監(jiān)督學(xué)習(xí))、NOISE(噪聲魯棒性)、OV(開放式詞匯情緒識別)三個賽道。其中,SEMI賽道因其高難度和實際應(yīng)用價值而頗受關(guān)注。Soul語音技術(shù)團隊在此賽道表現(xiàn)出色。

Soul語音技術(shù)團隊?wèi){借平臺深厚的技術(shù)積累和前瞻性的創(chuàng)新思路,成功克服了半監(jiān)督學(xué)習(xí)中面臨的諸多挑戰(zhàn)。他們不僅提出微調(diào)模型EmoVCLIP,用于適應(yīng)視頻的情感識別,還創(chuàng)新性地采用了Self-training策略,通過循環(huán)對無標(biāo)簽數(shù)據(jù)打偽標(biāo)簽與訓(xùn)練模型之間相互迭代的方式,來提升模型的泛化性能。此外,針對模型不同模態(tài)之間融合存在的競爭效應(yīng)問題,團隊首次在多模態(tài)情感識別領(lǐng)域使用Modality Dropout,有效提高了模型的情感識別準(zhǔn)確率。這些創(chuàng)新技術(shù)的應(yīng)用,不僅讓Soul語音技術(shù)團隊贏得了比賽,更為未來AI在社交場景中的應(yīng)用提供了寶貴的技術(shù)借鑒。

作為新型開放式社交平臺,Soul一直致力于通過底層技術(shù)和產(chǎn)品模式的創(chuàng)新,提升用戶的社交體驗。在Soul APP創(chuàng)始人張璐團隊的帶領(lǐng)下,Soul于2020年啟動AIGC技術(shù)研發(fā),并在智能對話、圖像生成、語音及音樂生成等AIGC關(guān)鍵技術(shù)領(lǐng)域取得了成果。

值得注意的是,Soul在AI社交領(lǐng)域的探索并未止步于技術(shù)層面。Soul APP創(chuàng)始人張璐團隊深知,在社交領(lǐng)域,AI的“情商”遠比“智商”更為重要。因此,他們在構(gòu)建AI模型時,始終注重其擬人化屬性的培養(yǎng),努力讓AI更能理解情緒,為用戶帶來更好的情緒反饋和陪伴感。這種以人為本的設(shè)計理念,使得Soul的AI社交產(chǎn)品能夠更好地滿足用戶的情感需求,實現(xiàn)更加有溫度、沉浸、趣味的互動交流。如今,Soul不僅構(gòu)建了具備多模態(tài)情感識別能力的語言大模型Soul X和語音大模型,還推出了“AI茍蛋”“狼人魅影”等功能/產(chǎn)品,讓AI在社交場景中發(fā)揮更加積極的作用。

在Soul APP創(chuàng)始人張璐團隊的領(lǐng)導(dǎo)下,Soul語音技術(shù)團隊獲多模態(tài)情感識別挑戰(zhàn)賽第一名。這不僅是對其技術(shù)實力的有力證明,也是對“AIGC+社交”發(fā)展方向的堅定信念,使得他們更堅定地去致力于構(gòu)建情感化、個性化和生活化的人機交互新場景,為用戶帶來更加優(yōu)質(zhì)的社交體驗。

申請創(chuàng)業(yè)報道,分享創(chuàng)業(yè)好點子。點擊此處,共同探討創(chuàng)業(yè)新機遇!

相關(guān)文章

熱門排行

信息推薦