文 | 智能相對論
作者 | 陳泊丞
日前,英偉達CEO黃仁勛和Meta創(chuàng)始人馬克?扎克伯格開展了一場“爐邊談話”。
兩人作為當今人工智能領域的領袖人物,一邊憑借AI芯片的絕對優(yōu)勢占據(jù)著算力領域的至高地位,另一邊借助開源大模型Llama 3.1強勢崛起成為開源領域的標桿。這樣的對話為未來AI的發(fā)展趨勢呈現(xiàn)了不同的視角。
黃仁勛對話扎克伯格
兩位大咖的對話為我們描繪了AI技術未來的發(fā)展藍圖:從開源的AI算法,到先進的人形機器人,到未來即將普及的智能眼鏡,AI技術發(fā)展充滿了機遇與挑戰(zhàn)。未來AI手機、AIPC、AI汽車、智能眼鏡、服務器等等各類產品都會實現(xiàn)智能化升級,復雜的模型、海量的數(shù)據(jù)和計算,都極大地依賴于AI算力支持。
AI算力也正在從專用計算擴展到所有的計算場景,逐步形成“一切計算皆AI”的格局。
事實上,算力廠商們的動作也見證了市場對算力發(fā)展的要求。一方面,CPU、GPU、NPU等各種PU,也都被用于了AI計算。
另一方面,在適配不同場景應用的通用服務器上,浪潮信息也在致力于提供兼具高性能與低成本的選擇。前不久,基于2U4路旗艦通用服務器NF8260G7,浪潮信息創(chuàng)新采用領先的張量并行、NF4模型量化等技術,實現(xiàn)了服務器僅依靠4顆CPU即可運行千億參數(shù)“源2.0”大模型,再度成為通用AI算力的新標桿。
在今天的市場上,算力的產業(yè)地位正在迅速崛起。對應人工智能發(fā)展的三駕馬車,算力、算法、數(shù)據(jù)三者終于到達了一個地位相當?shù)臓顟B(tài),走向“并駕齊驅”。
要知道,在AI技術發(fā)展的前期,中國龐大的互聯(lián)網用戶群體和豐富的在線數(shù)據(jù)資源,側重于數(shù)據(jù)的發(fā)展。而美國在計算機科學、數(shù)學和統(tǒng)計學等基礎學科方面有著悠久的研究傳統(tǒng),則更聚焦算法的研發(fā)。對比兩者,算力在前期的關注度就顯得弱了許多。
時至今日,三駕馬車并駕齊驅。大眾對人工智能的發(fā)展思路也愈發(fā)清晰——AI產業(yè)的爆發(fā)是算法、算力與數(shù)據(jù)三者協(xié)同發(fā)展的結果。而這樣的狀態(tài)也就代表著AI產業(yè)正在進入一個全新的階段。
人工智能產業(yè) 來到了“過彎點”
現(xiàn)階段,大模型技術的加速迭代,帶來了千億級大模型的持續(xù)涌現(xiàn)與精進。相關的AI應用也在以前所未有的速度和規(guī)模滲透到各行各業(yè),并融入日常的生活和工作中。
人工智能產業(yè)正在從初步探索進入到了廣泛應用的“過彎點”。在這個過程中,AI的三駕馬車也到了全面協(xié)同發(fā)展的關鍵時刻,才能為場景應用的跨越式升級提供必要的技術支持。
以銀行的防欺詐系統(tǒng)為例,早期的系統(tǒng)是基于大數(shù)據(jù)構建的,通過經驗預設規(guī)則和統(tǒng)計模型來判斷、檢測可疑交易。如今,基于更高性能的通用算力整合大數(shù)據(jù)系統(tǒng)和金融防詐的AI模型,銀行防欺詐系統(tǒng)實現(xiàn)了功能升級,不僅具備更高的準確性和更低的誤報率,而且還能夠根據(jù)新的數(shù)據(jù)自我學習和調整,快速適應新的欺詐模式。
算法、算力和數(shù)據(jù)三者協(xié)同,構成當前AI應用的基本范式。一個成功的AI項目往往需要在這三個方面都做出適當?shù)耐度牒蛢?yōu)化。
算法相當于AI的大腦,負責處理信息、學習知識、做出決策。而數(shù)據(jù)是算法的基礎,如果沒有足夠的數(shù)據(jù),即使是再先進的算法也無法發(fā)揮出應有的效果。
而在此基礎上,不管是算法的運行還是數(shù)據(jù)的處理,都離不開算力的支持。特別是在涉及到大量的數(shù)據(jù)處理、復雜的模型訓練以及實時的推理需求等場景中,AI對算力的要求,同時隨著場景的規(guī)?;占埃€得進一步兼顧經濟性。
現(xiàn)如今,針對AI產業(yè)的三駕馬車,算法、算力和數(shù)據(jù)層面的升級依舊在同步進行,三者之間的協(xié)同在AI行業(yè)發(fā)展的驅動下達到了新高度。AI產業(yè)的加速發(fā)展,需要三駕馬車的步伐更加一致。
是時候全面調整 三駕馬車的狀態(tài)了
人工智能的廣泛應用必然要建立在三駕馬車協(xié)同發(fā)展的基礎上。在接下來的時間內,針對人工智能產業(yè)的升級就需要解決一個關鍵問題,即如何保持三駕馬車并駕齊驅的穩(wěn)定狀態(tài)。
一、技術“并駕”:一馬當先并非最佳,三馬同行最為穩(wěn)定。
算力、算法、數(shù)據(jù)三者相輔相成,單一的技術領先無法帶來AI產業(yè)的全面爆發(fā),必須要另外兩項迅速補齊,才能對應解決相關的技術問題。
例如,在當前,千億級參數(shù)、甚至萬億級參數(shù)的大模型加速發(fā)展,帶來了更強大的信息處理和決策能力,為智能涌現(xiàn)提供了基礎。但是,算法層面的突破,必然要有算力、數(shù)據(jù)層面的升級,才能發(fā)揮出應用的效果。簡單來說,如果沒有足夠的算力帶動千億級大模型的訓練、推理等需求,那么再強大的模型也沒有“用武之地”。
要加速人工智能的發(fā)展,支撐千行百業(yè)最廣泛的通用場景,千億級大模型必須要和大數(shù)據(jù)、數(shù)據(jù)庫、云等場景相融合,實現(xiàn)高效運行。
但這一目標對計算、內存、通信等硬件資源需求量非常大。為了滿足更多用戶的AI算力需求,算力廠商不得不考慮如何有針對性地去克服現(xiàn)有的算力瓶頸。以承載千億參數(shù)大模型推理的NF8260G7 AI通用服務器來看,浪潮信息在這方面就做出了專業(yè)的設計。
針對千億級大模型推理過程中的低時延以及所需的巨大內存需求,NF8260G7服務器配置了4顆具有AMX的AI加速功能的英特爾至強處理器,內存方面,NF8260G7配置32根32G DDR5 4800MHZ的內存,內存帶寬實測值分別為995GB/s(讀帶寬)、423GB/s(寫帶寬)、437GB/s(讀寫帶寬),為滿足千億大模型低延時和多處理器的并發(fā)推理計算打下基礎。同時,浪潮信息還對CPU之間、CPU與內存之間的高速互聯(lián)信號走線路徑和阻抗連續(xù)性做了優(yōu)化,從而更好地支撐大規(guī)模并發(fā)計算。
這樣的設計與升級,旨在面向算法,進行算力的優(yōu)化,為接下來千億級大模型的規(guī)?;瘧锰峁┝艘粋€非常關鍵的支撐。
二、系統(tǒng)“齊驅”:三馬拉車,重在系統(tǒng)性優(yōu)化。
隨著AI技術的發(fā)展,算力、算法、數(shù)據(jù)三者的系統(tǒng)性越來越強。很多科技巨頭都在競相發(fā)力尋找「模型水平高、算力門檻低」的人工智能方案。AI相關的解決方案不再是單一技術的應用,而是綜合多個領域的突破實現(xiàn)整體系統(tǒng)性的升級。
舉個例子,谷歌的EfficientNet模型通過優(yōu)化網絡架構,在ImageNet數(shù)據(jù)集上的精度相比傳統(tǒng)模型提升了約6%,而所需計算量減少了70%??梢姡斍按竽P蛷S商在推動算力升級的過程中,也會考慮到軟件層面的創(chuàng)新,提高算力和算法之間的適配運行能力。
為了能讓通用服務器更好的運行千億級大模型,浪潮信息除了對服務器本身進行創(chuàng)新升級外,也對千億級大模型的參數(shù)規(guī)模做了優(yōu)化?;谠?.0的算法研發(fā)積累,浪潮信息將1026億參數(shù)的源2.0大模型卷積算子進行張量切分,為通用服務器進行高效的張量并行計算提供了可能,最終提高了推理計算效率。
基于CPU服務器的并行計算
同時,在這個過程中,浪潮信息還采用了NF4量化技術,對模型進行“瘦身”,提高了推理的解碼效率等等。
NF4量化技術
當算力、算法走向協(xié)同,系統(tǒng)性優(yōu)化的結果,是建立在兩者協(xié)同的基礎之上,最終目的在于為AI產業(yè)的落地提供一個穩(wěn)定、強大的技術底座。未來,AI產業(yè)的全面爆發(fā)就需要以更系統(tǒng)的理念去驅動三駕馬車的發(fā)展。
三、應用“加速”:產業(yè)落地需要“三駕馬車”的綜合最優(yōu)解。
AI不再是實驗室的產物,而是市場競爭的商品。不管是千億級大模型的涌現(xiàn),或是算力解決方案的升級,其根本的目標都是推動AI應用的加速落地,走向大眾,帶來實際性的經濟效益。因此,在技術層面之外,行業(yè)還需要考慮經濟層面的問題。
對比來看,盡管以英偉達GPU芯片為核心的AI服務器在處理機器學習、深度學習等高性能計算任務方面表現(xiàn)卓越,但是浪潮信息等算力廠商依舊致力于研發(fā)和升級以CPU為核心的通用服務器,這是為什么?
根本原因就在于CPU在通用計算、能效比以及成本效益方面仍然不可替代。特別是關系成本效益的經濟性問題,本來就是當前限制諸多場景應用規(guī)模化落地發(fā)展的關鍵因素。因為AI專用基礎設施的成本居高不下,普通的企業(yè)很難承受。而浪潮信息則是提供了一個更低成本、同時兼顧高性能的經濟性選擇,恰恰正是市場需要的。
基于通用服務器NF8260G7的軟硬件協(xié)同創(chuàng)新,浪潮信息成功實現(xiàn)了千億級大模型在通用服務器的推理部署,同時還提供了性能更強,成本更經濟的選擇,讓AI大模型應用可以與云、大數(shù)據(jù)、數(shù)據(jù)庫等應用能夠實現(xiàn)更緊密的融合,助力產業(yè)高質量發(fā)展。這樣的綜合最優(yōu)解,才是產業(yè)實現(xiàn)規(guī)?;l(fā)最需要的條件。
結語
AI三駕馬車的系統(tǒng)性已經成型,更強大的算力可以支持更復雜的算法模型,從而更好地處理大規(guī)模數(shù)據(jù)。同時,高質量的數(shù)據(jù)集有助于提升算法的效果,反過來又需要更強大的算力來處理。而算法的進步也可以減少對算力的需求,通過更高效的模型設計降低計算成本。
這種系統(tǒng)性的形成,將極大推動人工智能產業(yè)的發(fā)展,也為現(xiàn)階段AI廠商們的產品升級、技術迭代、服務進階提供了一個關鍵的大方向。但同時,也意味著新的挑戰(zhàn),即如何去整合算力、算法和數(shù)據(jù)三者之間的技術與資源,成就新的突破。
*本文圖片均來源于網絡
#智能相對論 Focusing on智能新產業(yè)新服務,這是智能的服務NO.263深度解讀
此內容為【智能相對論】原創(chuàng),
僅代表個人觀點,未經授權,任何人不得以任何方式使用,包括轉載、摘編、復制或建立鏡像。
部分圖片來自網絡,且未核實版權歸屬,不作為商業(yè)用途,如有侵犯,請作者與我們聯(lián)系。
•AI產業(yè)新媒體;
•澎湃新聞科技榜單月度top5;
•文章長期“霸占”鈦媒體熱門文章排行榜TOP10;
•著有《人工智能 十萬個為什么》
•【重點關注領域】智能家電(含白電、黑電、智能手機、無人機等AIoT設備)、智能駕駛、AI+醫(yī)療、機器人、物聯(lián)網、AI+金融、AI+教育、AR/VR、云計算、開發(fā)者以及背后的芯片、算法等。
申請創(chuàng)業(yè)報道,分享創(chuàng)業(yè)好點子。點擊此處,共同探討創(chuàng)業(yè)新機遇!
恒指今日維持震蕩盤整態(tài)勢,早間小幅低開后一路震蕩走強,恒生科技指數(shù)盤中一度漲超1%。截至收盤,恒指收漲0.09%,報18089.93點。盤面上,鋰電池板塊午前異軍突起漲幅居前,汽車股表現(xiàn)亮眼,半導體板塊回暖,黃金股走弱。盡管中國股票近一個月來走勢有所回調,但全球最大的上市對沖基金英仕曼集團(ManG
文|智能相對論作者|葉遠風產業(yè)升級如火如荼,通過數(shù)字化、智能化來激發(fā)“新動能”,已經成為普遍共識。但是,作為一個泛概念,“新動能”到底是什么,又如何具體到一些舉措、動作上,才能確保落地,從而切實推動產業(yè)升級?業(yè)界需要一個關于“新動能”如何被激發(fā)的切實路線圖。事實上,針對產業(yè)升級的“新動能”,最終還是
作者|曾響鈴文|響鈴說前幾年,在IDC領域,市場談及最多的還是數(shù)據(jù)中心,隨著人工智能產業(yè)的成熟,特別是今年以來大模型的爆發(fā),智算中心逐步替代了數(shù)據(jù)中心進入大眾視野,成為市場熱議的關鍵詞,智能算力的熱度持續(xù)上升。此前,工信部在相關新聞發(fā)布會上就披露,目前我國算力總規(guī)模居全球第二,保持著30%左右的年增
2025國際人工智能程序設計精英挑戰(zhàn)賽(IAEPC)在香港中文大學成功舉辦。來自深圳的學生吳林林作為主辦方記者團成員,采訪了大會嘉賓:全國政協(xié)委員、香港特別行政區(qū)立法會議員、香港中文大學工程學院副院長、IAEPC聯(lián)合發(fā)起人黃錦輝先生。在吳林林的采訪中,黃錦輝教授勉勵年輕人要像懂中文和英語一樣懂AI,
昨天新出了一個AI,據(jù)說比DeepSeek還牛,而截止到今早,已經有10萬人在排隊申請Manus邀請碼了,而且它邀請碼已經炒到10萬了。這是北京的一家人工智能公司蝴蝶科技,創(chuàng)始人是一名來自華中科技大學的90后畢業(yè)生肖弘,突然向全球宣布:世界上第一款真正的人工智能、通用智能體產品出現(xiàn)了,名叫Manus
謠言肆虐,擦亮眼睛
蘋果16弄了兩個版本,一個是專門給中國人用的,準備用百度的AI,還要交錢。第二個是全世界都可以用的,用了ChatGPT,包括臺灣、香港、澳門都可以用。以后都這樣了。好,問題就出在這,蘋果和百度的合作出現(xiàn)問題了,新聞連起來看,才能明白其中含義。新聞一:蘋果正在和騰訊、字節(jié)初步接洽,考慮將二者的AI模型
“技術日新月異,人類生活方式正在快速轉變,這一切給人類歷史帶來了一系列不可思議的奇點。我們曾經熟悉的一切,都開始變得陌生?!庇嬎銠C之父約翰·馮·諾依曼曾這樣說到。
“人工智能的商業(yè)模式,是要創(chuàng)造一個市場,而非一個算法”。這是世界AI泰斗MichaelI.Jordan的觀點。而當前的全球AI市場,占據(jù)主導地位的中美雙方,卻也走出了兩條截然不同的技術路徑,前者執(zhí)著于前沿技術的探索,后者則發(fā)力應用優(yōu)化和商業(yè)化落地。南轅北轍的兩個方向,或許已經無法直接進行排位先后、優(yōu)
智能體進化發(fā)展了一年,現(xiàn)在的RPAAgent迭代到什么程度了?從實在智能最新發(fā)布的實在Agent7.0,看RPAAgent的迭代升級抓取豆瓣信息、自己制作PPT,這款AIAgent真的實現(xiàn)了流程全自動化AIAgent構建到執(zhí)行全自動化,持續(xù)進化RPAAgent再次降低智能體應用門檻實在智能重磅發(fā)布實
崔大寶|節(jié)點財經創(chuàng)始人進入2024年,大模型似乎有熄火之勢:資本市場,與之關聯(lián)的概念炒不動了,英偉達股價動輒暴跌重挫,引發(fā)“泡沫戳破”的擔憂;消費市場,BATH們的推新活動少了,產品更新迭代的速度慢了,民眾的關注度降了……熱鬧的大概只剩下兩場酣仗:自5月15日字節(jié)跳動宣布“以厘計費”,打響國內大模型
文|智能相對論作者|陳泊丞好消息!你心心念念的事業(yè)單位發(fā)錄取公告了!壞消息!他們沒錄你,錄了個數(shù)字人。圖片來源網絡隨著數(shù)字人技術的突破,越來越多的傳統(tǒng)企業(yè)和機構開始用上了“數(shù)字員工”。甚至很多中國人心心念念的“鐵飯碗”,也被這些數(shù)字人給捧上了。數(shù)字人捧上了“鐵飯碗”簡單翻看一下全國各地事業(yè)單位的“錄