1. 創(chuàng)業(yè)頭條
  2. 前沿領(lǐng)域
  3. AI智能
  4. 正文

最后一公里不解決,大模型開閉源都一文不值

 2024-07-18 10:22  來源:A5專欄  我來投稿 撤稿糾錯

  域名預(yù)訂/競價,好“米”不錯過

對所有大模型而言,其真正考驗(yàn)如同科大訊飛創(chuàng)始人劉慶峰所說,在最后一公里的應(yīng)用和商業(yè)化落地上。

作者|Cindy

編輯|楊 銘

恐怕誰也不會想到,百模大戰(zhàn)進(jìn)入商業(yè)化下半場,圍繞大模型大規(guī)模、曠日持久的戰(zhàn)爭,竟是開源和閉源路線的交鋒。

最近,在2024世界人工智能大會(WAIC)上,劉慶峰、李彥宏、王堅(jiān)、朱嘯虎、傅盛等行業(yè)大佬,發(fā)表的截然不同觀點(diǎn),再次引發(fā)外界對大模型路線的關(guān)注。

比如,持續(xù)輸出“開源落后于閉源”“大模型場景下,開源是最貴的”觀點(diǎn)的百度創(chuàng)始人李彥宏,再次直言不諱認(rèn)為,開源是一種智商稅。獵豹移動董事長兼CEO傅盛,則繼王小川、周鴻祎之后,直接不客氣反駁李彥宏,稱“付費(fèi)閉源大模型才是智商稅”。谷歌前董事長施密特甚至在近日表示,中國AI發(fā)展基本靠西方開源,因此必須限制開源模型。

大模型賽道的開源閉源,主要是指模型源代碼、模型權(quán)重、訓(xùn)練數(shù)據(jù)是否公開。這場AI浪潮下科學(xué)界的戰(zhàn)爭,并非僅發(fā)生在中國企業(yè)身上——相比中國企業(yè)家的“文明交鋒”,國外企業(yè)和大佬更是采用直接短兵相接的肉搏戰(zhàn)方式。

去年2月以來,馬斯克屢屢發(fā)難,稱轉(zhuǎn)向閉源的OpenAI應(yīng)改名為“Close AI”。今年2月,馬斯克在舊金山法院對OpenAI及CEO阿爾特提起訴訟,要求OpenAI恢復(fù)開源并給予賠償。市場方面,去年7月Meta將Llama2(羊駝)開源后,和ChatGPT發(fā)生的一輪輪攻防戰(zhàn),同樣精彩紛呈。

風(fēng)云涌動中,圍繞大模型開閉源的白刃戰(zhàn)超過一年半。但至今誰也說服不了誰,誰也未取得決定性勝利,未來走向撲朔迷離。

唯一能確定的是,對公眾和企業(yè)來說,無論路線如何,解決不了最后一公里難題,開閉源都一文不值。對所有大模型而言,其真正考驗(yàn)如同科大訊飛創(chuàng)始人劉慶峰所說,在最后一公里的應(yīng)用和商業(yè)化落地上。

01

開閉源路線之爭的本質(zhì)

回顧互聯(lián)網(wǎng)和軟件史,開源和閉源的戰(zhàn)爭一直都在上演。

直到今天,這依然是兩股并行、截然不同的力量。開源方面,以Linux、Android、unix為代表;閉源方面,則有Windows、Mac OS、iOS、WP等等。

戰(zhàn)爭核心,在于技術(shù)進(jìn)步、‌安全保障、‌社會價值與經(jīng)濟(jì)效益之間的平衡探索。

開源認(rèn)為,應(yīng)允許任何人獲得并修改軟件的源代碼,如同一座橋梁,‌分享、融合才是其存在意義。閉源則認(rèn)為,軟件和代碼屬于勞動成果,勞動成果需要保護(hù)和用來獲取財富。

客觀看,開源促進(jìn)軟件繁榮和全球范圍內(nèi)合作,拓寬創(chuàng)新邊界上,居功至偉。但就商業(yè)價值層面來看,此前所有領(lǐng)域都被閉源吊打。

一切技術(shù)路線爭議終點(diǎn),需要商業(yè)化掙錢。這無可厚非,但需要意識到的是,AI大模型的路線戰(zhàn)爭,和此前任何一次開閉源戰(zhàn)爭都沒可對比性——業(yè)界共識是,大模型本身就是一個黑盒子,外界至今難以徹底揭開它的神秘。

從模型、算法到數(shù)據(jù),如何產(chǎn)生一個可以使用的模型,無人知曉。未來到底是走向中心化,還是去中心化,都是矛盾而又流行的說法。

這種神秘性,造就大模型的獨(dú)特性——無論是國外還是國內(nèi),都不是巨頭的一枝獨(dú)秀,從科研到創(chuàng)業(yè)者,再到千行百業(yè)開發(fā)者,都可以參與其中,讓大模型呈現(xiàn)百花齊放、百家爭鳴的蓬勃生態(tài)。

技術(shù)實(shí)力來看,如果以ChatGPT為標(biāo)尺,那么開源曾很長一段時間落后于閉源——到去年下半年,這種情況已經(jīng)改變,很多超過 ChatGPT 3.5,甚至追趕ChatGPT 4.0能力的大模型陸續(xù)發(fā)布。不過,在Sora發(fā)布后,閉源又獲得一段時間領(lǐng)先。

“閉源和開源大模型,很難說誰就會永遠(yuǎn)領(lǐng)先誰,這是一個永遠(yuǎn)在動態(tài)平衡變化的狀態(tài)。”多位業(yè)內(nèi)人士就認(rèn)為,其差距取決于,研發(fā)團(tuán)隊(duì)能力的差異,以及背后團(tuán)隊(duì)所持有的資金、算力、數(shù)據(jù)。

非得在開源與閉源之間,做選擇題嗎?顯然不是。

如今,在開閉源陣營之爭外,還有一條技術(shù)路線陣營正迅速擴(kuò)大——開源和閉源同時并行發(fā)展。在國外,以谷歌為代表;在國內(nèi),則包含科大訊飛、昆侖萬維、零一萬物、百川智能等企業(yè)。

這個陣營的技術(shù)實(shí)力,并不遜色任何開源或閉源企業(yè)。比如訊飛星火,V3.0版本在中文上全方位超越Chat GPT,英文上實(shí)現(xiàn)對標(biāo)。而在V4.0版本中,在8個國際主流測試集中排名第一,在文本生成、語言理解、知識問答、邏輯推理、數(shù)學(xué)能力等方面實(shí)現(xiàn)了對GPT-4 Turbo的整體超越。

02

開源與閉源,為何可以兩條腿走路

“極點(diǎn)商業(yè)”觀察來看,選擇開源、閉源“兩條腿”走路的企業(yè),布局大多主要遵循以下路徑:在最大模型上選擇閉源,在較小模型上選擇開源。

比如谷歌,就在推出“開源”大模型Gemma后,走上閉源+開源并行道路。有報道認(rèn)為這代表谷歌大模型策略的轉(zhuǎn)變——開源主打性能最強(qiáng)大的小規(guī)模模型,希望戰(zhàn)勝M(fèi)eta和Mistral AI;閉源則主打規(guī)模大效果最好的大模型,希望盡快追上OpenAI。

在國內(nèi),“兩條腿走路”的企業(yè)也類似。以科大訊飛為例,整體超越GPT-4 Turbo的訊飛星火V4.0是閉源,通過昇騰AI和訊飛星火的合作,打破大模型訓(xùn)練的瓶頸;而130億參數(shù)的星火開源-13B則是開源,在多項(xiàng)知名公開評測任務(wù)中名列前茅。

其實(shí),大模型不像手機(jī)操作系統(tǒng),必須在IOS或安卓之間二選一,對開發(fā)者、用戶、企業(yè)來說,考慮的很直接:這個大模型是否易用好用,又同時具有性價比?穩(wěn)定性、安全性是否可以保證?其生態(tài)和場景打造,又是否滿足用戶需求?

這意味著,讓所有用戶、企業(yè)、開發(fā)者乃至產(chǎn)業(yè),都能選擇合適自己的大模型,就是最好的大模型。

這也是科大訊飛“兩條腿走路”核心目的,通過“閉源+開源”完整體系,閉源專注商業(yè)應(yīng)用、產(chǎn)業(yè)落地,開源策略是生態(tài)開放,兩者優(yōu)勢“合二為一”,激發(fā)中國大模型的產(chǎn)業(yè)、生態(tài)活力。

在閉源部分,基于星火大模型V4.0,科大訊飛有面向TOC的AI應(yīng)用訊飛星火APP/Desk、星火智能批閱機(jī)、訊飛AI學(xué)習(xí)機(jī)、訊飛曉醫(yī)APP;面向TOB和生態(tài)伙伴,有星火企業(yè)智能體平臺、招采助手、機(jī)器人超腦平臺2. 0等等,讓企業(yè)可以構(gòu)建自己的智算底座。

星火開源公開測評數(shù)據(jù)

在開源的星火大模型,科大訊飛的策略是生態(tài)開放,通過免費(fèi)大模型,為開發(fā)者、學(xué)術(shù)界賦能。

“開源+閉源”兩條腿想順利走路關(guān)鍵,需要解決幾個關(guān)鍵問題,一是模型架構(gòu)自主可控,有一定技術(shù)優(yōu)勢,二是產(chǎn)業(yè)落地、商業(yè)模式完整,三是通過社區(qū)吸引更多開發(fā)者。

“誰控制了過去,誰就控制了未來;誰控制了現(xiàn)在,誰就控制了過去。”近年來,被“卡脖子”事件屢屢在我國科技產(chǎn)業(yè)上演,算力、數(shù)據(jù)是否會“卡大模型的脖子”,業(yè)界也是議論紛紛。

這意味著,主流國產(chǎn)、自主可控的模型架構(gòu),才可能最大限度發(fā)揮生態(tài)力量,匹配產(chǎn)業(yè)上下游環(huán)境,更好推進(jìn)開源、閉源的并行融合。

“所有算法都是我們自主可控的,大模型的每一行代碼、每一個數(shù)據(jù)都是我們自己編寫、清洗出來的。”劉慶峰表示。

而對處于早期的大模型來說,無論是開源、閉源,都需要聚集更多開發(fā)者,參與到開源模型的改進(jìn)和優(yōu)化。

在國外,包括Meta、谷歌和微軟以及第三方開發(fā)者都在社區(qū)內(nèi)發(fā)布模型、參數(shù)、數(shù)據(jù)集;在國內(nèi),訊飛開放平臺之上大模型總開發(fā)者超35萬,其中企業(yè)開發(fā)者超22萬,推動大模型應(yīng)用加速落地。

回顧PC、軟件、手機(jī)歷史,其實(shí)也有類似案例。比如在數(shù)據(jù)庫市場,Oracle就是“開源+閉源”兩條腿走路,在開源社區(qū)、商業(yè)應(yīng)用均取得了巨大成功。

谷歌、科大訊飛們的大模型“兩條路”邏輯其實(shí)也類似。一種解讀是,在大模型時代,開源、閉源只是手段,在不同產(chǎn)品和應(yīng)用場景中,兩者本是相輔相成。開源模型和開源社區(qū)可以在上游用免費(fèi)策略負(fù)責(zé)擴(kuò)大用戶基數(shù)、拓展產(chǎn)業(yè)生態(tài)、迭代模型技術(shù)。

來自開源部分的經(jīng)驗(yàn),也可以復(fù)用到閉源,讓閉源大模型的產(chǎn)業(yè)化、商業(yè)化落地更順暢——最終兩條路線以多元化、靈活化的方式演進(jìn),并行甚至融合互補(bǔ)。

“實(shí)際上這兩塊是相互補(bǔ)充的。”科大訊飛創(chuàng)始人劉慶峰也認(rèn)為。他以星火開源13B模型為例指出,等650億、1500億、1750億參數(shù)以及更大模型出來,就知道了它的天花板和邊界,再對它進(jìn)行裁剪、濃縮,就變成13B,那13B的效果也提升了。

“如果不做閉源,不探索行業(yè)最高的天花板,開源也做不到最好。”劉慶峰就認(rèn)為。

“兩條腿”走路的互補(bǔ)價值,浙江大學(xué)人工智能研究所所長吳飛一個觀點(diǎn)是,任何開源基座模型,都是千錘百煉而來,不是所有公司和機(jī)構(gòu)都具備這樣的能力。“在開源之上進(jìn)行閉源,可以很大程度上降低閉源模型研發(fā)的門檻。”

03

最后一公里才是真正挑戰(zhàn)

從劉慶峰、李彥宏、王小川等行業(yè)大佬觀點(diǎn)來看,一個共同之處是:閉源、開源只是手段,關(guān)鍵是讓大模型,如何快速應(yīng)用千行百業(yè)場景里,如何作為生產(chǎn)力工具,更好地普惠,去替代人類完成各類業(yè)務(wù)流的碎片、繁雜工作。

這意味著,對國內(nèi)目前尚處于高速發(fā)展階段的大模型而言,隨著開源、閉源路線的逐漸并行融合,選擇什么路線不是關(guān)鍵問題。

不同場景適配不同的參數(shù)。如同劉慶峰所說,無論大模型如何演進(jìn),最后一公里的產(chǎn)品體驗(yàn)和應(yīng)用落地,才是真正挑戰(zhàn)。

這也是誰能在“百模大戰(zhàn)”中占有一席之地,擁有更多的話語權(quán)的關(guān)鍵。如果解決不好最后一公里,那么技術(shù)路線將一文不值。當(dāng)前國內(nèi)大模型企業(yè)的應(yīng)用開發(fā)的普遍思路是,并未等到技術(shù)完全成熟再落地應(yīng)用,而是在快速迭代技術(shù)同時,從ToC、ToB兩端入手,相應(yīng)地進(jìn)行產(chǎn)業(yè)和應(yīng)用落地。

這一點(diǎn),在剛剛結(jié)束的WAIC上也體現(xiàn)得很明顯??拼笥嶏w、百度、阿里巴巴、騰訊、華為、字節(jié)跳動、快手等行業(yè)巨頭,以及百川、智譜等新銳帶來眾多新技術(shù)和新產(chǎn)品,展現(xiàn)了大模型和金融、醫(yī)療、教育、政務(wù)等多個行業(yè)、產(chǎn)業(yè)的深度融合。

關(guān)于如何更好地解決企業(yè)大模型應(yīng)用的“最后一公里”問題,科大訊飛經(jīng)過和大量的央國企和行業(yè)合作伙伴的共同探討,他們認(rèn)為用智能體平臺打造每個崗位專屬助手的時間已經(jīng)到了。

在這之前,星火已經(jīng)成功賦能了很多場景,無論是代碼、數(shù)字勞動力,還是評標(biāo)、客戶、APP智能互動??拼笥嶏w與太平洋保險合作是從審計這個崗位做起的,包括客服和評標(biāo);此外,國家能源集團(tuán)、中國石油等公司選了科大訊飛作為合作伙伴;同時,星火大模型賦能中國移動APP幾億用戶,使中國移動APP更加智能、交互更順暢。

通過這么多的場景可以看到,大模型賦能企業(yè)“人工智能+”行動有兩個方面:一方面是大模型直接完成任務(wù),訊飛星火一開始啟用,文本生成、語言理解、知識問答、邏輯推理和代碼能力對應(yīng)到下面相關(guān)的各種各樣的工具,它自己就完成了,不需要借助任何外力。

還有一種模式是以認(rèn)知大模型為中心大腦,它調(diào)動各種專用模型,比如說振動的模型、味覺模型、氣體模型,濕度模型等各種模型,然后配合相應(yīng)的工具,再對接內(nèi)外部的各種信源和數(shù)據(jù),打通內(nèi)部的辦公OA、ERP系統(tǒng),再對接外部實(shí)時性來聯(lián)合完成任務(wù),相當(dāng)于用大模型來指揮調(diào)度一系列的能力,從而完成一個綜合的任務(wù)。

面向B端,從劉慶峰闡述來看,訊飛星火大模型在“最后一公里”用智能體平臺打造專屬于每個崗位的工作助手,在智能家電、智能汽車、運(yùn)營商、機(jī)器人等行業(yè)場景實(shí)現(xiàn)全面賦能,甚至成為各行各業(yè)創(chuàng)新發(fā)展的重要驅(qū)動力。

面向具身智能和人形機(jī)器人企業(yè)需求,目前400+機(jī)器人企業(yè)已經(jīng)采用訊飛機(jī)器人超腦平臺。另外,星火企業(yè)智能體平臺將圍繞智能體關(guān)鍵能力,覆蓋400+AI原子能力,集成 90+外部信源,打通100+內(nèi)部 IT 系統(tǒng),可供企業(yè)結(jié)合業(yè)務(wù)場景快速構(gòu)建可落地的智能體應(yīng)用。

“解決AI+行動的最后一公里的問題,是前所未有的機(jī)遇。”劉慶峰就表示,星火已經(jīng)成功賦能了很多場景,無論是代碼、數(shù)字勞動力,還是評標(biāo)、客戶、APP智能互動。

不完全統(tǒng)計顯示,訊飛星火大模型正成為國家能源集團(tuán)、中國石油、中國移動、中國人保、太平洋保險、交通銀行、海爾集團(tuán)、美的集團(tuán)等多領(lǐng)域頭部企業(yè)的首選。

公開招標(biāo)網(wǎng)數(shù)據(jù)就顯示,今年上半年到6月中旬,整個公開招標(biāo)數(shù)量約為234件。其中,60%以上的項(xiàng)目來自央國企。在央國企大模型訂單中標(biāo)企業(yè)中,訊飛星火高居第一。

“我們能走多遠(yuǎn),取決于我們是否擁有自主開發(fā)的、可控的基礎(chǔ)能。”從劉慶峰表態(tài)來看,這是大模型如何解放生產(chǎn)力、釋放每個人、每家企業(yè),甚至每位開發(fā)者想象力的關(guān)鍵。

“合抱之木,生于毫末,九層之臺,起于壘土。”如同劉慶峰的說法,這正是大模型能力階段跨越的體現(xiàn)——意味著大模型從技術(shù)附加工具,轉(zhuǎn)向引領(lǐng)行業(yè)變革、助力企業(yè)降本增效、普惠大眾生活的關(guān)鍵階段。而針對更多商業(yè)化模式的探索,也正悄然形成“模型越強(qiáng)、落地越多、用戶越廣、算力越大”的增長飛輪。

從這個角度看,只要能做大生態(tài),加速產(chǎn)業(yè)最后一公里的落地,無論是大模型技術(shù)路線是閉源,還是開源,其實(shí)一點(diǎn)都不重要。

申請創(chuàng)業(yè)報道,分享創(chuàng)業(yè)好點(diǎn)子。點(diǎn)擊此處,共同探討創(chuàng)業(yè)新機(jī)遇!

相關(guān)標(biāo)簽
大模型

相關(guān)文章

  • 庫克已納投名狀:蘋果AI沒得選,只能選百度

    蘋果16弄了兩個版本,一個是專門給中國人用的,準(zhǔn)備用百度的AI,還要交錢。第二個是全世界都可以用的,用了ChatGPT,包括臺灣、香港、澳門都可以用。以后都這樣了。好,問題就出在這,蘋果和百度的合作出現(xiàn)問題了,新聞連起來看,才能明白其中含義。新聞一:蘋果正在和騰訊、字節(jié)初步接洽,考慮將二者的AI模型

    標(biāo)簽:
    蘋果AI
    百度AI
    庫克
  • AI加速時代的“進(jìn)度條”,我們撥動了百分之幾?

    “技術(shù)日新月異,人類生活方式正在快速轉(zhuǎn)變,這一切給人類歷史帶來了一系列不可思議的奇點(diǎn)。我們曾經(jīng)熟悉的一切,都開始變得陌生?!庇嬎銠C(jī)之父約翰·馮·諾依曼曾這樣說到。

    標(biāo)簽:
    ai智能
  • AI視頻賽道,要變天了

    “毀滅你,與你何干?”,這是在劉慈欣的科幻小說《三體》里用來形容人類與三體人之間的戰(zhàn)爭的一句話。

    標(biāo)簽:
    ai智能
  • “創(chuàng)造市場”與“算法進(jìn)化”,中美AI競速的岔路口

    “人工智能的商業(yè)模式,是要創(chuàng)造一個市場,而非一個算法”。這是世界AI泰斗MichaelI.Jordan的觀點(diǎn)。而當(dāng)前的全球AI市場,占據(jù)主導(dǎo)地位的中美雙方,卻也走出了兩條截然不同的技術(shù)路徑,前者執(zhí)著于前沿技術(shù)的探索,后者則發(fā)力應(yīng)用優(yōu)化和商業(yè)化落地。南轅北轍的兩個方向,或許已經(jīng)無法直接進(jìn)行排位先后、優(yōu)

    標(biāo)簽:
    ai智能
  • 智能體進(jìn)化發(fā)展了一年,現(xiàn)在的RPA Agent迭代到什么程度了?

    智能體進(jìn)化發(fā)展了一年,現(xiàn)在的RPAAgent迭代到什么程度了?從實(shí)在智能最新發(fā)布的實(shí)在Agent7.0,看RPAAgent的迭代升級抓取豆瓣信息、自己制作PPT,這款A(yù)IAgent真的實(shí)現(xiàn)了流程全自動化AIAgent構(gòu)建到執(zhí)行全自動化,持續(xù)進(jìn)化RPAAgent再次降低智能體應(yīng)用門檻實(shí)在智能重磅發(fā)布實(shí)

  • 崔大寶:大模型降溫背后的難點(diǎn)、卡點(diǎn)、節(jié)點(diǎn)

    崔大寶|節(jié)點(diǎn)財經(jīng)創(chuàng)始人進(jìn)入2024年,大模型似乎有熄火之勢:資本市場,與之關(guān)聯(lián)的概念炒不動了,英偉達(dá)股價動輒暴跌重挫,引發(fā)“泡沫戳破”的擔(dān)憂;消費(fèi)市場,BATH們的推新活動少了,產(chǎn)品更新迭代的速度慢了,民眾的關(guān)注度降了……熱鬧的大概只剩下兩場酣仗:自5月15日字節(jié)跳動宣布“以厘計費(fèi)”,打響國內(nèi)大模型

    標(biāo)簽:
    大模型
  • 這一屆“出道”的數(shù)字人,已經(jīng)拿捧上了“鐵飯碗”

    文|智能相對論作者|陳泊丞好消息!你心心念念的事業(yè)單位發(fā)錄取公告了!壞消息!他們沒錄你,錄了個數(shù)字人。圖片來源網(wǎng)絡(luò)隨著數(shù)字人技術(shù)的突破,越來越多的傳統(tǒng)企業(yè)和機(jī)構(gòu)開始用上了“數(shù)字員工”。甚至很多中國人心心念念的“鐵飯碗”,也被這些數(shù)字人給捧上了。數(shù)字人捧上了“鐵飯碗”簡單翻看一下全國各地事業(yè)單位的“錄

    標(biāo)簽:
    數(shù)字人
  • 來到IPO關(guān)口,地平線離“三分天下”還有多遠(yuǎn)?

    黑芝麻智能敲鐘后,港交所門口又有一些智駕芯片企業(yè)引發(fā)關(guān)注。據(jù)悉,近日地平線已通過中國證監(jiān)會IPO備案,擬發(fā)行不超過11.5億股境外上市普通股并在香港聯(lián)合交易所上市,預(yù)計籌集約5億美元資金。從天眼查可以了解到,該公司成立于2015年,是一家乘用車高級輔助駕駛(ADAS)和高階自動駕駛(AD)解決方案供

  • 機(jī)器人大會引領(lǐng)產(chǎn)業(yè)動向,卓翼飛思繪制無人系統(tǒng)教科研新藍(lán)圖

    8月21日,萬眾矚目的2024世界機(jī)器人大會暨博覽會在北京亦創(chuàng)國際會展中心盛大開幕。這場為期5天,集“展覽”“論壇”“賽事”于一體的機(jī)器人盛會,反映了當(dāng)下機(jī)器人領(lǐng)域的繁榮生態(tài)。據(jù)官方統(tǒng)計數(shù)據(jù),今年現(xiàn)場逛展觀眾高達(dá)25萬人次,比去年增加25%。機(jī)器人行業(yè)有多火?看看2024世界機(jī)器人大會火爆程度便可知

編輯推薦