最后一公里不解決，大模型開閉源都一文不值

2024-07-18 10:22 來源：A5專欄我來投稿撤稿糾錯

對所有大模型而言，其真正考驗如同科大訊飛創(chuàng)始人劉慶峰所說，在最后一公里的應(yīng)用和商業(yè)化落地上。

作者|Cindy

編輯|楊銘

恐怕誰也不會想到，百模大戰(zhàn)進(jìn)入商業(yè)化下半場，圍繞大模型大規(guī)模、曠日持久的戰(zhàn)爭，竟是開源和閉源路線的交鋒。

最近，在2024世界人工智能大會（WAIC）上，劉慶峰、李彥宏、王堅、朱嘯虎、傅盛等行業(yè)大佬，發(fā)表的截然不同觀點，再次引發(fā)外界對大模型路線的關(guān)注。

比如，持續(xù)輸出“開源落后于閉源”“大模型場景下，開源是最貴的”觀點的百度創(chuàng)始人李彥宏，再次直言不諱認(rèn)為，開源是一種智商稅。獵豹移動董事長兼CEO傅盛，則繼王小川、周鴻祎之后，直接不客氣反駁李彥宏，稱“付費閉源大模型才是智商稅”。谷歌前董事長施密特甚至在近日表示，中國AI發(fā)展基本靠西方開源，因此必須限制開源模型。

大模型賽道的開源閉源，主要是指模型源代碼、模型權(quán)重、訓(xùn)練數(shù)據(jù)是否公開。這場AI浪潮下科學(xué)界的戰(zhàn)爭，并非僅發(fā)生在中國企業(yè)身上——相比中國企業(yè)家的“文明交鋒”，國外企業(yè)和大佬更是采用直接短兵相接的肉搏戰(zhàn)方式。

去年2月以來，馬斯克屢屢發(fā)難，稱轉(zhuǎn)向閉源的OpenAI應(yīng)改名為“Close AI”。今年2月，馬斯克在舊金山法院對OpenAI及CEO阿爾特提起訴訟，要求OpenAI恢復(fù)開源并給予賠償。市場方面，去年7月Meta將Llama2（羊駝）開源后，和ChatGPT發(fā)生的一輪輪攻防戰(zhàn)，同樣精彩紛呈。

風(fēng)云涌動中，圍繞大模型開閉源的白刃戰(zhàn)超過一年半。但至今誰也說服不了誰，誰也未取得決定性勝利，未來走向撲朔迷離。

唯一能確定的是，對公眾和企業(yè)來說，無論路線如何，解決不了最后一公里難題，開閉源都一文不值。對所有大模型而言，其真正考驗如同科大訊飛創(chuàng)始人劉慶峰所說，在最后一公里的應(yīng)用和商業(yè)化落地上。

開閉源路線之爭的本質(zhì)

回顧互聯(lián)網(wǎng)和軟件史，開源和閉源的戰(zhàn)爭一直都在上演。

直到今天，這依然是兩股并行、截然不同的力量。開源方面，以Linux、Android、unix為代表；閉源方面，則有Windows、Mac OS、iOS、WP等等。

戰(zhàn)爭核心，在于技術(shù)進(jìn)步、‌安全保障、‌社會價值與經(jīng)濟(jì)效益之間的平衡探索。

開源認(rèn)為，應(yīng)允許任何人獲得并修改軟件的源代碼，如同一座橋梁，‌分享、融合才是其存在意義。閉源則認(rèn)為，軟件和代碼屬于勞動成果，勞動成果需要保護(hù)和用來獲取財富。

客觀看，開源促進(jìn)軟件繁榮和全球范圍內(nèi)合作，拓寬創(chuàng)新邊界上，居功至偉。但就商業(yè)價值層面來看，此前所有領(lǐng)域都被閉源吊打。

一切技術(shù)路線爭議終點，需要商業(yè)化掙錢。這無可厚非，但需要意識到的是，AI大模型的路線戰(zhàn)爭，和此前任何一次開閉源戰(zhàn)爭都沒可對比性——業(yè)界共識是，大模型本身就是一個黑盒子，外界至今難以徹底揭開它的神秘。

從模型、算法到數(shù)據(jù)，如何產(chǎn)生一個可以使用的模型，無人知曉。未來到底是走向中心化，還是去中心化，都是矛盾而又流行的說法。

這種神秘性，造就大模型的獨特性——無論是國外還是國內(nèi)，都不是巨頭的一枝獨秀，從科研到創(chuàng)業(yè)者，再到千行百業(yè)開發(fā)者，都可以參與其中，讓大模型呈現(xiàn)百花齊放、百家爭鳴的蓬勃生態(tài)。

技術(shù)實力來看，如果以ChatGPT為標(biāo)尺，那么開源曾很長一段時間落后于閉源——到去年下半年，這種情況已經(jīng)改變，很多超過 ChatGPT 3.5，甚至追趕ChatGPT 4.0能力的大模型陸續(xù)發(fā)布。不過，在Sora發(fā)布后，閉源又獲得一段時間領(lǐng)先。

“閉源和開源大模型，很難說誰就會永遠(yuǎn)領(lǐng)先誰，這是一個永遠(yuǎn)在動態(tài)平衡變化的狀態(tài)。”多位業(yè)內(nèi)人士就認(rèn)為，其差距取決于，研發(fā)團(tuán)隊能力的差異，以及背后團(tuán)隊所持有的資金、算力、數(shù)據(jù)。

非得在開源與閉源之間，做選擇題嗎？顯然不是。

如今，在開閉源陣營之爭外，還有一條技術(shù)路線陣營正迅速擴(kuò)大——開源和閉源同時并行發(fā)展。在國外，以谷歌為代表；在國內(nèi)，則包含科大訊飛、昆侖萬維、零一萬物、百川智能等企業(yè)。

這個陣營的技術(shù)實力，并不遜色任何開源或閉源企業(yè)。比如訊飛星火，V3.0版本在中文上全方位超越Chat GPT，英文上實現(xiàn)對標(biāo)。而在V4.0版本中，在8個國際主流測試集中排名第一，在文本生成、語言理解、知識問答、邏輯推理、數(shù)學(xué)能力等方面實現(xiàn)了對GPT-4 Turbo的整體超越。

開源與閉源，為何可以兩條腿走路

“極點商業(yè)”觀察來看，選擇開源、閉源“兩條腿”走路的企業(yè)，布局大多主要遵循以下路徑：在最大模型上選擇閉源，在較小模型上選擇開源。

比如谷歌，就在推出“開源”大模型Gemma后，走上閉源+開源并行道路。有報道認(rèn)為這代表谷歌大模型策略的轉(zhuǎn)變——開源主打性能最強(qiáng)大的小規(guī)模模型，希望戰(zhàn)勝Meta和Mistral AI；閉源則主打規(guī)模大效果最好的大模型，希望盡快追上OpenAI。

在國內(nèi)，“兩條腿走路”的企業(yè)也類似。以科大訊飛為例，整體超越GPT-4 Turbo的訊飛星火V4.0是閉源，通過昇騰AI和訊飛星火的合作，打破大模型訓(xùn)練的瓶頸；而130億參數(shù)的星火開源-13B則是開源，在多項知名公開評測任務(wù)中名列前茅。

其實，大模型不像手機(jī)操作系統(tǒng)，必須在IOS或安卓之間二選一，對開發(fā)者、用戶、企業(yè)來說，考慮的很直接：這個大模型是否易用好用，又同時具有性價比？穩(wěn)定性、安全性是否可以保證？其生態(tài)和場景打造，又是否滿足用戶需求？

這意味著，讓所有用戶、企業(yè)、開發(fā)者乃至產(chǎn)業(yè)，都能選擇合適自己的大模型，就是最好的大模型。

這也是科大訊飛“兩條腿走路”核心目的，通過“閉源+開源”完整體系，閉源專注商業(yè)應(yīng)用、產(chǎn)業(yè)落地，開源策略是生態(tài)開放，兩者優(yōu)勢“合二為一”，激發(fā)中國大模型的產(chǎn)業(yè)、生態(tài)活力。

在閉源部分，基于星火大模型V4.0，科大訊飛有面向TOC的AI應(yīng)用訊飛星火APP/Desk、星火智能批閱機(jī)、訊飛AI學(xué)習(xí)機(jī)、訊飛曉醫(yī)APP；面向TOB和生態(tài)伙伴，有星火企業(yè)智能體平臺、招采助手、機(jī)器人超腦平臺2. 0等等，讓企業(yè)可以構(gòu)建自己的智算底座。

星火開源公開測評數(shù)據(jù)

在開源的星火大模型，科大訊飛的策略是生態(tài)開放，通過免費大模型，為開發(fā)者、學(xué)術(shù)界賦能。

“開源+閉源”兩條腿想順利走路關(guān)鍵，需要解決幾個關(guān)鍵問題，一是模型架構(gòu)自主可控，有一定技術(shù)優(yōu)勢，二是產(chǎn)業(yè)落地、商業(yè)模式完整，三是通過社區(qū)吸引更多開發(fā)者。

“誰控制了過去，誰就控制了未來；誰控制了現(xiàn)在，誰就控制了過去。”近年來，被“卡脖子”事件屢屢在我國科技產(chǎn)業(yè)上演，算力、數(shù)據(jù)是否會“卡大模型的脖子”，業(yè)界也是議論紛紛。

這意味著，主流國產(chǎn)、自主可控的模型架構(gòu)，才可能最大限度發(fā)揮生態(tài)力量，匹配產(chǎn)業(yè)上下游環(huán)境，更好推進(jìn)開源、閉源的并行融合。

“所有算法都是我們自主可控的，大模型的每一行代碼、每一個數(shù)據(jù)都是我們自己編寫、清洗出來的。”劉慶峰表示。

而對處于早期的大模型來說，無論是開源、閉源，都需要聚集更多開發(fā)者，參與到開源模型的改進(jìn)和優(yōu)化。

在國外，包括Meta、谷歌和微軟以及第三方開發(fā)者都在社區(qū)內(nèi)發(fā)布模型、參數(shù)、數(shù)據(jù)集；在國內(nèi)，訊飛開放平臺之上大模型總開發(fā)者超35萬，其中企業(yè)開發(fā)者超22萬，推動大模型應(yīng)用加速落地。

回顧PC、軟件、手機(jī)歷史，其實也有類似案例。比如在數(shù)據(jù)庫市場，Oracle就是“開源+閉源”兩條腿走路，在開源社區(qū)、商業(yè)應(yīng)用均取得了巨大成功。

谷歌、科大訊飛們的大模型“兩條路”邏輯其實也類似。一種解讀是，在大模型時代，開源、閉源只是手段，在不同產(chǎn)品和應(yīng)用場景中，兩者本是相輔相成。開源模型和開源社區(qū)可以在上游用免費策略負(fù)責(zé)擴(kuò)大用戶基數(shù)、拓展產(chǎn)業(yè)生態(tài)、迭代模型技術(shù)。

來自開源部分的經(jīng)驗，也可以復(fù)用到閉源，讓閉源大模型的產(chǎn)業(yè)化、商業(yè)化落地更順暢——最終兩條路線以多元化、靈活化的方式演進(jìn)，并行甚至融合互補(bǔ)。

“實際上這兩塊是相互補(bǔ)充的。”科大訊飛創(chuàng)始人劉慶峰也認(rèn)為。他以星火開源13B模型為例指出，等650億、1500億、1750億參數(shù)以及更大模型出來，就知道了它的天花板和邊界，再對它進(jìn)行裁剪、濃縮，就變成13B，那13B的效果也提升了。

“如果不做閉源，不探索行業(yè)最高的天花板，開源也做不到最好。”劉慶峰就認(rèn)為。

“兩條腿”走路的互補(bǔ)價值，浙江大學(xué)人工智能研究所所長吳飛一個觀點是，任何開源基座模型，都是千錘百煉而來，不是所有公司和機(jī)構(gòu)都具備這樣的能力。“在開源之上進(jìn)行閉源，可以很大程度上降低閉源模型研發(fā)的門檻。”

最后一公里才是真正挑戰(zhàn)

從劉慶峰、李彥宏、王小川等行業(yè)大佬觀點來看，一個共同之處是：閉源、開源只是手段，關(guān)鍵是讓大模型，如何快速應(yīng)用千行百業(yè)場景里，如何作為生產(chǎn)力工具，更好地普惠，去替代人類完成各類業(yè)務(wù)流的碎片、繁雜工作。

這意味著，對國內(nèi)目前尚處于高速發(fā)展階段的大模型而言，隨著開源、閉源路線的逐漸并行融合，選擇什么路線不是關(guān)鍵問題。

不同場景適配不同的參數(shù)。如同劉慶峰所說，無論大模型如何演進(jìn)，最后一公里的產(chǎn)品體驗和應(yīng)用落地，才是真正挑戰(zhàn)。

這也是誰能在“百模大戰(zhàn)”中占有一席之地，擁有更多的話語權(quán)的關(guān)鍵。如果解決不好最后一公里，那么技術(shù)路線將一文不值。當(dāng)前國內(nèi)大模型企業(yè)的應(yīng)用開發(fā)的普遍思路是，并未等到技術(shù)完全成熟再落地應(yīng)用，而是在快速迭代技術(shù)同時，從ToC、ToB兩端入手，相應(yīng)地進(jìn)行產(chǎn)業(yè)和應(yīng)用落地。

這一點，在剛剛結(jié)束的WAIC上也體現(xiàn)得很明顯?？拼笥嶏w、百度、阿里巴巴、騰訊、華為、字節(jié)跳動、快手等行業(yè)巨頭，以及百川、智譜等新銳帶來眾多新技術(shù)和新產(chǎn)品，展現(xiàn)了大模型和金融、醫(yī)療、教育、政務(wù)等多個行業(yè)、產(chǎn)業(yè)的深度融合。

關(guān)于如何更好地解決企業(yè)大模型應(yīng)用的“最后一公里”問題，科大訊飛經(jīng)過和大量的央國企和行業(yè)合作伙伴的共同探討，他們認(rèn)為用智能體平臺打造每個崗位專屬助手的時間已經(jīng)到了。

在這之前，星火已經(jīng)成功賦能了很多場景，無論是代碼、數(shù)字勞動力，還是評標(biāo)、客戶、APP智能互動。科大訊飛與太平洋保險合作是從審計這個崗位做起的，包括客服和評標(biāo)；此外，國家能源集團(tuán)、中國石油等公司選了科大訊飛作為合作伙伴；同時，星火大模型賦能中國移動APP幾億用戶，使中國移動APP更加智能、交互更順暢。

通過這么多的場景可以看到，大模型賦能企業(yè)“人工智能+”行動有兩個方面：一方面是大模型直接完成任務(wù)，訊飛星火一開始啟用，文本生成、語言理解、知識問答、邏輯推理和代碼能力對應(yīng)到下面相關(guān)的各種各樣的工具，它自己就完成了，不需要借助任何外力。

還有一種模式是以認(rèn)知大模型為中心大腦，它調(diào)動各種專用模型，比如說振動的模型、味覺模型、氣體模型，濕度模型等各種模型，然后配合相應(yīng)的工具，再對接內(nèi)外部的各種信源和數(shù)據(jù)，打通內(nèi)部的辦公OA、ERP系統(tǒng)，再對接外部實時性來聯(lián)合完成任務(wù)，相當(dāng)于用大模型來指揮調(diào)度一系列的能力，從而完成一個綜合的任務(wù)。

面向B端，從劉慶峰闡述來看，訊飛星火大模型在“最后一公里”用智能體平臺打造專屬于每個崗位的工作助手，在智能家電、智能汽車、運營商、機(jī)器人等行業(yè)場景實現(xiàn)全面賦能，甚至成為各行各業(yè)創(chuàng)新發(fā)展的重要驅(qū)動力。

面向具身智能和人形機(jī)器人企業(yè)需求，目前400+機(jī)器人企業(yè)已經(jīng)采用訊飛機(jī)器人超腦平臺。另外，星火企業(yè)智能體平臺將圍繞智能體關(guān)鍵能力，覆蓋400+AI原子能力，集成 90+外部信源，打通100+內(nèi)部 IT 系統(tǒng)，可供企業(yè)結(jié)合業(yè)務(wù)場景快速構(gòu)建可落地的智能體應(yīng)用。

“解決AI+行動的最后一公里的問題，是前所未有的機(jī)遇。”劉慶峰就表示，星火已經(jīng)成功賦能了很多場景，無論是代碼、數(shù)字勞動力，還是評標(biāo)、客戶、APP智能互動。

不完全統(tǒng)計顯示，訊飛星火大模型正成為國家能源集團(tuán)、中國石油、中國移動、中國人保、太平洋保險、交通銀行、海爾集團(tuán)、美的集團(tuán)等多領(lǐng)域頭部企業(yè)的首選。

公開招標(biāo)網(wǎng)數(shù)據(jù)就顯示，今年上半年到6月中旬，整個公開招標(biāo)數(shù)量約為234件。其中，60%以上的項目來自央國企。在央國企大模型訂單中標(biāo)企業(yè)中，訊飛星火高居第一。

“我們能走多遠(yuǎn)，取決于我們是否擁有自主開發(fā)的、可控的基礎(chǔ)能。”從劉慶峰表態(tài)來看，這是大模型如何解放生產(chǎn)力、釋放每個人、每家企業(yè)，甚至每位開發(fā)者想象力的關(guān)鍵。

“合抱之木，生于毫末，九層之臺，起于壘土。”如同劉慶峰的說法，這正是大模型能力階段跨越的體現(xiàn)——意味著大模型從技術(shù)附加工具，轉(zhuǎn)向引領(lǐng)行業(yè)變革、助力企業(yè)降本增效、普惠大眾生活的關(guān)鍵階段。而針對更多商業(yè)化模式的探索，也正悄然形成“模型越強(qiáng)、落地越多、用戶越廣、算力越大”的增長飛輪。

從這個角度看，只要能做大生態(tài)，加速產(chǎn)業(yè)最后一公里的落地，無論是大模型技術(shù)路線是閉源，還是開源，其實一點都不重要。

申請創(chuàng)業(yè)報道，分享創(chuàng)業(yè)好點子。點擊此處，共同探討創(chuàng)業(yè)新機(jī)遇！