2019年10月10日,睿象云CEO 高科在京召開新聞發(fā)布會(huì)宣布:公司歷時(shí)18個(gè)月,在中山大學(xué)數(shù)據(jù)科學(xué)與計(jì)算機(jī)學(xué)院陳鵬飛團(tuán)隊(duì)的鼎力協(xié)助下,成功構(gòu)建了國內(nèi)第一個(gè)中文運(yùn)維知識(shí)圖譜(Chinse Operation Knowledge Graph,以下簡稱:COKG)。
隨著國內(nèi)近10年來IT云化和微服務(wù)化的持續(xù)火熱,企業(yè)對(duì)運(yùn)維能力的要求開始不斷提高。人工智能算法的不斷突破,也讓越來越多的企業(yè)開始嘗試購買和使用智能運(yùn)維平臺(tái)來幫助自身從自動(dòng)化運(yùn)維走向智能化運(yùn)維。
睿象云正是一家?guī)椭髽I(yè)智能化運(yùn)維轉(zhuǎn)型的公司。自成立以來,睿象云致力于通過人工智能技術(shù)來提升企業(yè)的智能化運(yùn)維能力。在開展 AIOps 相關(guān)項(xiàng)目的過程中,睿象云的技術(shù)人員逐漸發(fā)現(xiàn)運(yùn)維知識(shí)圖譜是 AIOps 的基石,在不依托運(yùn)維領(lǐng)域的知識(shí)圖譜的情況下,根因定位的準(zhǔn)確度,運(yùn)維知識(shí)推薦等一系列智能運(yùn)維的場景都無法達(dá)到令人滿意的效果。
深度挖掘海量信息,AIOps需要知識(shí)圖譜
眾所周知,計(jì)算機(jī)擅長處理結(jié)構(gòu)化形式的數(shù)據(jù),為了讓計(jì)算機(jī)能夠處理這些信息,就必須要理解這些非結(jié)構(gòu)化形式數(shù)據(jù)所蘊(yùn)含的語義,分析其中的語義單元之間的關(guān)系,從而將其轉(zhuǎn)換成結(jié)構(gòu)化形式。而“圖”是一種可以有效表示數(shù)據(jù)之間結(jié)構(gòu)的表達(dá)形式。因此,如果將數(shù)據(jù)中蘊(yùn)含的知識(shí)用“圖”的結(jié)構(gòu)進(jìn)行形式化表示,將數(shù)據(jù)的結(jié)構(gòu)化與已有的結(jié)構(gòu)化數(shù)據(jù)進(jìn)行關(guān)聯(lián),檢索與查找的便利性就能得到極大的提升。這便是Google 公司于2012年提出的“知識(shí)圖譜”的概念。
然而,在復(fù)雜的IT運(yùn)維領(lǐng)域中,隨著海量的事件不斷出現(xiàn)以及多數(shù)據(jù)源融合的交叉應(yīng)用,致使傳統(tǒng)的IT運(yùn)維管理模式一直很難突破對(duì)人的巨大依賴。一旦系統(tǒng)出現(xiàn)嚴(yán)重告警事件,如果沒有豐富的運(yùn)維經(jīng)驗(yàn)或者了解系統(tǒng)脈絡(luò)的人員,很難快速地解決IT系統(tǒng)故障問題,被運(yùn)維工程師們寄予厚望的AIOps也只能是紙上談兵。
睿象云研發(fā)團(tuán)隊(duì)經(jīng)過深思熟慮,提出了一個(gè)基于知識(shí)圖譜搭建智能運(yùn)維體系的新構(gòu)架。睿象云的團(tuán)隊(duì)認(rèn)為,企業(yè)的IT知識(shí)和通用領(lǐng)域下的IT知識(shí)要沉淀到運(yùn)維圖譜里面,然后結(jié)合從IT生產(chǎn)系統(tǒng)采集的指標(biāo)和事件數(shù)據(jù),搭建出企業(yè)完整的智能運(yùn)維平臺(tái)。相比傳統(tǒng)的運(yùn)維體系,知識(shí)圖譜數(shù)據(jù)庫可迅速調(diào)用IT事件之間的關(guān)系,通過系統(tǒng)推理輔助分析并得出問題根因,極大地提升事件處理效率,讓業(yè)務(wù)運(yùn)行更加可靠。
圖1:基于知識(shí)圖譜搭建智能運(yùn)維體系的新構(gòu)架
首個(gè)“中文運(yùn)維知識(shí)圖譜”,IT事件關(guān)聯(lián)智能解析
傳統(tǒng)模式下,企業(yè)的IT知識(shí)和通用領(lǐng)域下的IT知識(shí)通常蘊(yùn)含在數(shù)據(jù)之中。這些海量的數(shù)據(jù)中包含了大量運(yùn)維領(lǐng)域的相關(guān)知識(shí)和資深技巧以及蘊(yùn)含經(jīng)驗(yàn)的有用信息。只有通過基于知識(shí)圖譜搭建智能運(yùn)維體系的框架下,計(jì)算機(jī)才能自動(dòng)閱讀、分析、理解這些海量、繁雜乃至泛濫的數(shù)據(jù),從中挖掘有價(jià)值的知識(shí),繼而向使用者提供精準(zhǔn)知識(shí)服務(wù),最終實(shí)現(xiàn)真正的AIOps。
睿象云的研發(fā)團(tuán)隊(duì)聯(lián)合中山大學(xué)數(shù)據(jù)科學(xué)與計(jì)算機(jī)學(xué)院的陳鵬飛教授團(tuán)隊(duì),經(jīng)過了長達(dá)一年半的緊密合作,終于趕在新中國70年華誕時(shí)刻,完成了國內(nèi)首個(gè)運(yùn)維領(lǐng)域的知識(shí)圖譜——中文運(yùn)維知識(shí)圖譜COKG。
圖2:COKG中文運(yùn)維知識(shí)圖譜模型
睿象云本次發(fā)布的“中文運(yùn)維知識(shí)圖譜”包含了30多萬個(gè)實(shí)體、400萬個(gè)實(shí)體關(guān)系,是目前中國運(yùn)維領(lǐng)域首個(gè)公開發(fā)布的知識(shí)圖譜。此舉將傳統(tǒng)基于淺層語義分析的信息服務(wù)范式提升到基于深層語義的知識(shí)服務(wù)。不僅在學(xué)術(shù)層面和商業(yè)層面有具有深刻意義,更是代表了新代智能化運(yùn)維的基礎(chǔ)設(shè)施業(yè)已建成。
圖3:中文運(yùn)維知識(shí)圖譜實(shí)體示例
全景圖譜深度挖掘 根因定位不是夢
COKG將不同IT事件的碎片化數(shù)據(jù)信息進(jìn)行多維度整合,依托自動(dòng)語義分析算法,能夠收集企業(yè)內(nèi)部的事件類數(shù)據(jù)(機(jī)器日志、告警等),IT配置信息(業(yè)務(wù)調(diào)用關(guān)系、CMDB等),和知識(shí)數(shù)據(jù)(故障手冊(cè)、廠家文檔、告警處理意見等)等三種IT運(yùn)維數(shù)據(jù)。通過事件驅(qū)動(dòng)發(fā)現(xiàn)異常事件,自動(dòng)分析事件根因,并且各種事件均可溯源,方便企業(yè)探究問題根因,精準(zhǔn)管控風(fēng)險(xiǎn)源頭,做到標(biāo)本兼治,消滅風(fēng)險(xiǎn)于萌芽。另外COKG可對(duì)企業(yè)IT系統(tǒng)進(jìn)行秒級(jí)實(shí)時(shí)數(shù)據(jù)抓取和分析,對(duì)于未來可能發(fā)生的威脅及時(shí)預(yù)警,并結(jié)合解決方案智能推薦形成企業(yè)內(nèi)部智能運(yùn)維體系閉環(huán),令企業(yè)的運(yùn)維管理達(dá)到“運(yùn)籌帷幄,決勝千里”。
圖4:睿象云智能事件平臺(tái)
此次發(fā)布的知識(shí)圖譜更在交互方面具備了兩個(gè)顯著優(yōu)勢:
1. 表示方法對(duì)使用者友好
傳統(tǒng)知識(shí)表示方法和描述語言需要運(yùn)維工程師具備一定的專業(yè)知識(shí)和技能,非資深人群難以使用。COKG以實(shí)體和實(shí)體關(guān)系為基礎(chǔ)的簡潔表示形式,無論是專家還是入行小白都容易接受,這給以眾包等方式編輯和構(gòu)建知識(shí)提供了便利,為一線運(yùn)維人員參與大規(guī)模知識(shí)構(gòu)建提供了低認(rèn)知成本的保證。
2. 表示方法對(duì)計(jì)算機(jī)友好,支持高效推理
推理是知識(shí)表示的重要目標(biāo),傳統(tǒng)方法在進(jìn)行知識(shí)推理時(shí)復(fù)雜度很高,難以快速有效地處理。COKG表示形式以圖結(jié)構(gòu)為基礎(chǔ),結(jié)合圖論相關(guān)算法的前沿技術(shù),利用對(duì)節(jié)點(diǎn)和路徑的遍歷搜索,可以有效提高推理效率,極大降低計(jì)算機(jī)處理成本。
除此之外,通過本次發(fā)布的運(yùn)維知識(shí)圖譜,AIOps算法的準(zhǔn)確度也能得到相應(yīng)的提升。以根因分析為例,在沒有圖譜的情況下,算法是完全沒有任何知識(shí)儲(chǔ)備的,它只能通過概率或者頻率去區(qū)分事件之間是否存在關(guān)聯(lián)關(guān)系。
而有了知識(shí)圖譜之后,便可以把領(lǐng)域內(nèi)的復(fù)雜知識(shí)通過信息抽取、數(shù)據(jù)挖掘、語義匹配語義計(jì)算、知識(shí)推理等過程精確地描述出來,并且可以描述知識(shí)的演化過程和發(fā)展規(guī)律,從而為研究和決策提供準(zhǔn)確、可追蹤、可解釋、可推理的知識(shí)數(shù)據(jù)。在實(shí)際操作中,使用者只需要在建立好的圖譜查找相關(guān)問題,便可快速提供解決方案,極大地增強(qiáng)了企業(yè)的決策能力。
結(jié)尾
從20世紀(jì)90年代開始,以統(tǒng)計(jì)機(jī)器學(xué)習(xí)為核心的人工智能技術(shù)逐步占據(jù)主流。進(jìn)人新世紀(jì),隨著互聯(lián)網(wǎng)的蓬勃發(fā)展,IT系統(tǒng)數(shù)據(jù)規(guī)模呈現(xiàn)爆炸式增長的趨勢,IT事件類型也更加復(fù)雜多變。因此,這次COKG的發(fā)布,于整個(gè)運(yùn)維界來說,也是一件十分具有里程碑意義的壯舉。
知識(shí)圖譜將是企業(yè)里面最重要的數(shù)據(jù)資產(chǎn)之一,睿象云也將持續(xù)努力,幫助企業(yè)更好的搭建出屬于自己的AIOps平臺(tái)。
想了解更多關(guān)于運(yùn)維知識(shí)圖譜的相關(guān)信息,歡迎登陸aiops.com,和我們一起探討知識(shí)圖譜的相關(guān)話題。
申請(qǐng)創(chuàng)業(yè)報(bào)道,分享創(chuàng)業(yè)好點(diǎn)子。點(diǎn)擊此處,共同探討創(chuàng)業(yè)新機(jī)遇!