域名預(yù)訂/競(jìng)價(jià),好“米”不錯(cuò)過(guò)
在剛剛舉辦的光合組織領(lǐng)導(dǎo)人大會(huì) AI 技術(shù)分論壇上,青云科技分享了在 AI 算力領(lǐng)域的技術(shù)探索、產(chǎn)品與服務(wù)能力以及在不同場(chǎng)景的落地、與海光的多層次合作等。
讓算力“發(fā)動(dòng)機(jī)”更強(qiáng)勁
眾所周知,算力是新生產(chǎn)力,與數(shù)據(jù)和算法共同構(gòu)成數(shù)字經(jīng)濟(jì)時(shí)代最基本的生產(chǎn)要素。在 AI 時(shí)代中,算力扮演著“發(fā)動(dòng)機(jī)”的角色,它為人工智能提供了強(qiáng)大的計(jì)算和數(shù)據(jù)處理能力,使得 AI 能夠更快地進(jìn)行模型訓(xùn)練、推理和優(yōu)化。
青云科技(qingcloud.com)在服務(wù)企業(yè)的云基礎(chǔ)設(shè)施建設(shè)過(guò)程中,捕捉了企業(yè)除了通用算力之外,對(duì)超算算力、智能算力的需求,并敏銳洞察了對(duì)于多元異構(gòu)算力的統(tǒng)一調(diào)度與管理將成為新型數(shù)據(jù)中心的重大需求。
在這一洞察下,青云探索全新的技術(shù)架構(gòu),涉及到異構(gòu) GPU 架構(gòu)、高速無(wú)損網(wǎng)絡(luò)、高速并行文件存儲(chǔ)、大規(guī)模訓(xùn)練及推理加速優(yōu)化套件、向量數(shù)據(jù)庫(kù)、數(shù)據(jù)集服務(wù)等,同時(shí)也在規(guī)劃如何更好支持自服務(wù)與持續(xù)運(yùn)營(yíng)、支持應(yīng)用與業(yè)務(wù)創(chuàng)新。
首先要做到的就是屏蔽復(fù)雜的硬件基礎(chǔ)設(shè)施,將算力、存力、運(yùn)力、框架、組件以服務(wù)方式交付,其次是穩(wěn)定可靠且持續(xù)運(yùn)行的計(jì)量計(jì)費(fèi)平臺(tái),并且提供可私有化部署落地的產(chǎn)品方案。建立廣泛的智算上下游生態(tài)也至關(guān)重要。
最終,青云通過(guò)一個(gè)軟件平臺(tái)—— AI 智算平臺(tái),實(shí)現(xiàn)向下統(tǒng)一調(diào)度和管理多元異構(gòu)的 IT 資源,向上承載大模型、行業(yè)應(yīng)用等,同時(shí)通過(guò)統(tǒng)一的運(yùn)營(yíng)平臺(tái)和門戶,使得“交付、使用、管理、運(yùn)營(yíng)”多位一體。
青云 AI 智算平臺(tái)基于青云云原生底座,在異構(gòu)資源池化方面也表現(xiàn)優(yōu)異。如面向人工智能企業(yè)的訓(xùn)練場(chǎng)景,最終用戶可以快速申請(qǐng)資源,快速搭建計(jì)算的分布式訓(xùn)練平臺(tái),優(yōu)化業(yè)務(wù)和開(kāi)發(fā)流程,打通開(kāi)發(fā)環(huán)境、訓(xùn)練環(huán)境、數(shù)據(jù)資源,提高科研效率。與此同時(shí),通過(guò)資源動(dòng)態(tài)調(diào)整與自動(dòng)釋放,AI 智算平臺(tái)使得異構(gòu)算力資源利用率明顯提升:假定每人固定分配 1-2 張物理算力卡,統(tǒng)計(jì)發(fā)現(xiàn)峰值利用率僅 21.8%,平均利用率低于 10%,通過(guò)分布式任務(wù)調(diào)度策略,按需動(dòng)態(tài)掛載和釋放算力資源,資源效能節(jié)省 60% 以上。
加速企業(yè) AI 落地的最后一公里
青云在 AI 智算領(lǐng)域積極展開(kāi)生態(tài)合作,比如與海光共同打造了全棧國(guó)產(chǎn)的異構(gòu)算力解決方案,同時(shí)上線了海光異構(gòu)加速算力專區(qū), 實(shí)現(xiàn)了海光異構(gòu)加速卡的靈活調(diào)度和虛擬化管理。
青云 AI 生態(tài)的開(kāi)放性不僅體現(xiàn)在底層硬件的兼容適配上,也體現(xiàn)在大模型、應(yīng)用中間件、 AI 應(yīng)用等廠商與開(kāi)發(fā)者的廣泛合作上,通過(guò)聯(lián)合技術(shù)創(chuàng)新及解決方案,進(jìn)一步提升 AI 智算平臺(tái)的產(chǎn)品能力與服務(wù)能力,加速企業(yè) AI 落地的最后一公里。
以 AI 訓(xùn)練場(chǎng)景為例,基于AI 智算平臺(tái)的“調(diào)度”這一核心能力,青云客戶可以根據(jù)需要靈活編排包括算力資源、存儲(chǔ)資源、網(wǎng)絡(luò)資源以及運(yùn)維運(yùn)營(yíng)等基礎(chǔ)要素,并獲得敏捷彈性的響應(yīng)能力、高效智能的管理能力。如此一來(lái),用戶 AI 訓(xùn)練的平均等待和完成時(shí)間分別減少了 46% 和 21%,訓(xùn)練任務(wù)的遷移性能提升了 3.7 倍,訓(xùn)練任務(wù)可擴(kuò)縮容性提升了 10-80 倍。
青云 AI 智算開(kāi)發(fā)平臺(tái)還支持模型的推理和微調(diào),同時(shí)通過(guò)大模型服務(wù)平臺(tái)提供完整的大模型場(chǎng)景化落地能力,集成大模型及模型應(yīng)用開(kāi)發(fā)平臺(tái)生態(tài)能力建設(shè),面向行業(yè)領(lǐng)域構(gòu)建場(chǎng)景化解決方案。
在 AI 時(shí)代,青云致力于打造強(qiáng)大、靈活且高效的算力基石,并通過(guò)一系列創(chuàng)新的技術(shù)和服務(wù),攜手更多志同道合的伙伴,推動(dòng) AI 技術(shù)在各行各業(yè)中的廣泛應(yīng)用和發(fā)展。
申請(qǐng)創(chuàng)業(yè)報(bào)道,分享創(chuàng)業(yè)好點(diǎn)子。點(diǎn)擊此處,共同探討創(chuàng)業(yè)新機(jī)遇!