近年來運(yùn)維技術(shù)飛速發(fā)展,運(yùn)維團(tuán)隊大多建設(shè)好了各種系統(tǒng),虛擬化、容器化、持續(xù)集成等等。但是如何有效的利用這些系統(tǒng)最終實現(xiàn)站點(diǎn)的高可用、高性能、高可擴(kuò)展?隨著智能化技術(shù)的發(fā)展,為了解決上述運(yùn)維領(lǐng)域的問題,智能運(yùn)維的呼聲越來越高。
在日志易產(chǎn)品總監(jiān)饒琛琳看來,目前國內(nèi)智能運(yùn)維發(fā)展還處于一個探索階段,要想盡快在智能運(yùn)維領(lǐng)域有所突破,首先要重點(diǎn)做好監(jiān)控系統(tǒng)和告警系統(tǒng),并利用機(jī)器學(xué)習(xí)算法進(jìn)行快速監(jiān)控和排障。
饒琛琳對智能運(yùn)維的發(fā)展,做了三個階段的預(yù)測:
智能地判斷告警
傳統(tǒng)的 IT 運(yùn)維需要管理大量的告警,極大地分散了企業(yè)的注意力,消耗運(yùn)維人員大量的時間和創(chuàng)新力。想辦法高效地解決一天收到幾千封告警郵件的情況,把運(yùn)維人員從紛繁復(fù)雜的告警和噪音中解脫出來, 是一個能夠迅速產(chǎn)生價值的思路。
智能地判斷告警,而不是依據(jù)經(jīng)驗設(shè)定閾值,設(shè)定告警閾值是一項耗時耗力的工作,需要運(yùn)維人員在充分了解業(yè)務(wù)的前提下才能進(jìn)行,還得考慮業(yè)務(wù)是不是平穩(wěn)發(fā)展?fàn)顟B(tài),否則一兩周改動一次,運(yùn)維工程師將會疲于奔命。
日志易剛剛發(fā)布的1.10.1版本,對告警的管理和統(tǒng)計做了很大改進(jìn),不同顏色代表不同等級告警,用戶可以非常直觀的看到不同優(yōu)先級別的告警數(shù)量占比與處理進(jìn)程。另外,為了應(yīng)對告警風(fēng)暴,日志易設(shè)有一套告警規(guī)則,根據(jù)告警屬性分類收起,保證用戶能夠直觀瀏覽到最新告警的概況。
日志易饒琛琳:運(yùn)維的未來是智能運(yùn)維
日志易的告警機(jī)制,不僅提供了豐富的告警類型,如基線告警、SPL(搜索處理語言Search Processing Language)告警,還針對企業(yè)版用戶提供了告警轉(zhuǎn)發(fā)接口,將日志易系統(tǒng)的告警通過HTTP接口POST給接收機(jī)器,從而非常方便的與客戶現(xiàn)有的告警監(jiān)控系統(tǒng)相集成。
智能地定位故障
現(xiàn)在的故障定位完全依賴于人的經(jīng)驗和CMDB的完備性,但維護(hù)一個復(fù)雜的CMDB本身又是大難題。智能運(yùn)維應(yīng)該可以從相關(guān)性分析等方面,輔助運(yùn)維人員快速定位故障。
日志易1.10.1版本發(fā)布了一個新功能——基于聚類算法的日志模式發(fā)現(xiàn)。借助機(jī)器學(xué)習(xí)技術(shù)讓運(yùn)維更智能。
新版本在搜索界面上,添加了一個切換標(biāo)簽“模式”。根據(jù)搜索結(jié)果的數(shù)據(jù)間相似度,該功能采用聚類算法對日志進(jìn)行聚類合并,形成一個個包含相似數(shù)據(jù)的數(shù)據(jù)集,方便用戶在查看種類繁多的搜索結(jié)果時,進(jìn)行快捷的模式行為分析。
通過算法快速幫助使用者找到數(shù)據(jù)中隱藏的規(guī)律,這將大大節(jié)省工作量,提高分析效率。
日志易饒琛琳:運(yùn)維的未來是智能運(yùn)維
基于自然語言處理的自動反饋機(jī)制
利用一些 NLP(自然語言處理)技術(shù),對自然語言寫成的故障報告進(jìn)行處理,自動反饋到智能運(yùn)維系統(tǒng)里。這一點(diǎn)可能是更遙遠(yuǎn)的一個設(shè)想,但會是將來發(fā)展的一條道路。
到日志易官網(wǎng)了解更多智能運(yùn)維文章。
申請創(chuàng)業(yè)報道,分享創(chuàng)業(yè)好點(diǎn)子。點(diǎn)擊此處,共同探討創(chuàng)業(yè)新機(jī)遇!