6月30日,[AI實驗室]第四期在上海舉辦,來自Face++與UCloud、Video++、思必馳的4位嘉賓帶來了關于AI技術以及行業(yè)應用的演講,詳解AI技術如何開啟智能時代。
如何利用公有云快速落地AI應用
(圖:UCloud AI專家宋翔)
“AI是重資源、重消耗的技術,智能時代需要AI快速與行業(yè)結合,并快速實現(xiàn)AI應用的迭代。”UCloud AI專家宋翔表示。
AI落地過程中,需要考慮的問題:
一.什么場景需要AI賦能?
二.如何快速、低投入的驗證AI技術?
三.如何快速展開AI應用業(yè)務?
一.如何高效實現(xiàn)AI應用迭代?
AI落地的挑戰(zhàn):
建立的AI框架時常會遇到硬件迭代、算法更新以及算法兼容性等問題,并且還需要考慮整個系統(tǒng)的彈性和容災能力,保證業(yè)務的穩(wěn)定。
AI落地技術挑戰(zhàn)的解決思路
首先,要做到環(huán)境分離和分布式化。環(huán)境分離可以分為三層,最上層是AI相關的軟件層,中間是硬件,包括GPU的硬件,底層是存儲數(shù)據(jù)。通過容器將分層封裝,使得上下期間沒有強耦合性,提升整個平臺的擴展性。
如何利用公有云快速落地AI運用?
公有云支持AI應用落地,主要考慮兩方面:一是基于公有云平臺計算的資源,包括計算、網(wǎng)絡、多機房、跨地域;二是基礎的架構,包括云主機、容器、負載均衡等基礎組建。最后搭建一個PaaS服務平臺,包括訓練平臺和在線服務平臺。
AI助力行業(yè)智能
(圖:Face++人工智能開放平臺行業(yè)產(chǎn)品負責人胡浩)
計算機視覺在手機行業(yè)的落地:
Face++人工智能開放平臺行業(yè)產(chǎn)品負責人胡浩認為,手機行業(yè)主要解決安全和娛樂兩個痛點。從安全的角度來說,人臉解鎖相較指紋、虹膜,具有速度快、非接觸、抗干擾的特點,從而更安全。娛樂的角度來說,人臉識別技術在手機上有非常多可以應用的地方,比如美顏、摳圖、打光、視線估計、手勢、人體骨骼關鍵點、3D結構光等,可服務于手機上各種有趣的應用,更好的進行人機互動。
計算機視覺在其它行業(yè)的落地:
除手機之外,CV在汽車、教育、營銷、制造業(yè)都有很大的想象空間。汽車就是做DMS,駕駛員是否疲勞,車內(nèi)是否有遺留活物;教育行業(yè)做打卡、教學評估;營銷方面通過人的行為分析,找到精準用戶以及利用人臉技術策劃線上活動;制造業(yè)可做異常檢測,如正規(guī)的流程是否完整,有沒有漏缺等。
技術落地的思路
一項新技術落地有三個階段:第一是技術驅(qū)動,由技術去找場景;第二考慮現(xiàn)狀是什么,即場景驅(qū)動;第三是商業(yè)驅(qū)動,看技術到底能給行業(yè)創(chuàng)造多大的價值。如果這三個步驟都能夠說通,即是一項技術在一個行業(yè)真正的落地,并且有持續(xù)的發(fā)展,當落地之后才能夠收集到更多實驗室里面模擬不出來的數(shù)據(jù),算法才能夠在剩下的所有環(huán)節(jié)替代人工,實現(xiàn)真正的人工智能。
人工智能在消費級視頻中的應用
(圖:極鏈科技Video++ AI中心運營總監(jiān)魏傳勇)
上海極鏈網(wǎng)絡科技有限公司Video++ AI中心運營總監(jiān)魏傳勇介紹,中國超過5億的互聯(lián)網(wǎng)視頻用戶,占總互聯(lián)網(wǎng)用戶比重超過了70%,平均每天花超過120分鐘在互聯(lián)網(wǎng)視頻上,包括長視頻、短視頻、直播視頻等,這就是消費級視頻。
如何利用AI技術讓視頻更有趣,更有價值?
Video++在運用AI技術賦能視頻的過程中,不斷讓視頻變得更有趣、更有價值,我們通過對非結構化的視頻數(shù)據(jù)進行結構化處理,實現(xiàn)人臉、場景、物體、品牌等內(nèi)容的動態(tài)追蹤識別,進而將視頻解構成為更有價值的場景活動單元,再將其應用到如廣告、電商、互娛等各種商業(yè)化場景中去。
技術落地消費級視頻的挑戰(zhàn)
由于視頻辨識環(huán)境問題,辨識目標遮擋情況、屏幕占比、運動狀態(tài)都會使視頻內(nèi)容的辨識難度大大增加,而Video++獨創(chuàng)的全序列采樣識別,在準確率與抓取率上都具有革新性提升,最大化地去除了軌跡流中的抽樣與識別噪聲,以實現(xiàn)視頻動態(tài)內(nèi)容更精準的識別。
商業(yè)化落地的應用
Video++的ASMP系統(tǒng)就是AI技術成功落地并實現(xiàn)大批量商用的產(chǎn)品之一。立足AI技術對視頻內(nèi)容的識別,將非結構化的視頻內(nèi)容經(jīng)由AI處理后,產(chǎn)出與廣告主需求匹配的視頻場景單元。此時,廣告主結合自身的品牌特性進行投放,會取得更好的效果,經(jīng)測算這種投放效果的ROI可以提升50%以上。
智能語音交互在企業(yè)中的應用
(思必馳北京研發(fā)院產(chǎn)品經(jīng)理劉博)
思必馳北京研發(fā)院產(chǎn)品經(jīng)理劉博就語音交互技術在企業(yè)中的應用做了相關分享。他認為,目前市面上很火的智能音箱、智能機器人等產(chǎn)品的核心是對話機器人,常見的對話機器人形態(tài)主要分為三大類,分別是個人助理、聊天機器人以及智能設備。
個人助理如siri,可以設定鬧鐘日程、查詢天氣等;聊天機器人,比如小冰,可以講笑話、閑聊;智能設備,比如天貓精靈、車蘿卜、小米電視等,通過對話來實現(xiàn)導航、聽音樂、講故事等功能。
劉博稱,以上幾類對話機器人背后的對話技術主要有任務型對話、基于知識圖譜的對話、基于問答對的對話,以及生成式對話。
但以上幾種人機對話中都存在一個問題,那就是用戶在提問中占主導地位,機器往往處于被動狀態(tài),等待用戶提問后,再試圖理解用戶意圖,只有在發(fā)現(xiàn)某些必須的參數(shù)信息缺失后,機器才會主動向用戶發(fā)問。這類對話關系中,人是主動方,機器是被動方,適用于人主動且有明確訴求的場景。但這種對話系統(tǒng)會有一個缺陷,就是如果用戶想不起來話題或者具體提問方式時,會覺得交互體驗很不佳。
基于此問題,思必馳將推出了一種新的對話技術。劉博表示,在新的對話關系中,機器將成為主動方,而人則成為被機器引導完成對話的一方,這款基于新型對話技術的新產(chǎn)品將用于企業(yè)服務中。
申請創(chuàng)業(yè)報道,分享創(chuàng)業(yè)好點子。點擊此處,共同探討創(chuàng)業(yè)新機遇!