配置管理是IT服務管理的核心流程,為各項運維工作提供準確、一致、規范的配置數據,從而提升數據中心整體運維/運營管理效率。CMDB是配置管理的主要支撐工具,用于存儲和管理配置數據。傳統CMDB存在建設周期長、成本高、見效慢問題。面向運營的CMDB能夠有效縮短建設周期、降低運營成本、更快的發揮配置管理效益。
一、一個魚缸的啟示
前不久公司買了一個大魚缸,里面有珊瑚、小丑魚、水晶蝦、海星,非常漂亮。可好景不長,一周后魚缸狀態開始變糟,兩周后熱帶魚一條條死去,珊瑚焦逐漸被海藻吞噬,海星也失蹤了…
幾萬塊開的缸,為何不到一個月就變這樣,缸里發生了什么?大家百思不得解,于是找來養魚師傅。師傅看了看,淡淡的說:“開缸容易養缸難”。
原來,專業的養缸方法是這樣的:
每天8~10小時燈管照射、持續檢查水溫
每天檢查水位高度、及時補充蒸發掉的水分
每周換水一次,每次換水25%,鹽度比重控制在1.022-1.23
滴定調試,測試各主要微量元素數據,PH值保持在7.9-8
定期添加硝化細菌、更換生態棉和活性炭、清理化氮器
…
魚和珊瑚不宜過多,否則對水系統負荷太大
師傅走了,但“開缸容易養缸難”這句話久久縈繞于心。如果“水”是“數據”,“珊瑚和魚”是“收益”,那么養魚和配置管理是何等相似。
二、開缸易養缸難,CMDB尤其難
就養魚而言,開缸是容易的,搞個大容器灌滿水就行。同樣,建設CMDB也不難,搞個數據庫,灌進數據就可以了。但大部分CMDB的建設成效并不好,常遇到如下問題:
數據質量問題
數據質量無法滿足消費需求是配置管理面臨的首要問題,包括數據完整性、準確性和有效性三個方面。完整性和準確性問題指CI的條目和屬性信息與IT環境不一致。數據有效性問題指數據格式與標準不一致,無法用于程序運算分析。
數據質量問題應被及時監測和整改,否則會打擊消費信心。然而由于配置數據在持續變化且缺乏有效的技術手段,配置管理員往往很難從CMDB中甄別出有缺陷的數據。
使用體驗問題
除數據質量外,另一個主要需求是數據能被方便獲取、易理解以及可被下游系統調用。傳統CMDB雖然具備上述能力,但使用體驗較差。比如搜索界面復雜,響應時間長;CI關聯關系無法直觀呈現,難以理解;數據接口定制開發難等。
很多CMDB存在上述使用體驗問題,導致用戶更愿意使用Excel或者自建配置庫。
運營方法問題
數據質量和使用體驗較差的根本原因是缺乏有效的運營。CMDB誕生20年來,人們對它的認識經歷了以下幾個階段:
- 早期,人們認為CMDB就是一個庫,把數據扔進去就行,結果卻發現產生不了任何價值
- 后來,人們將CMDB與資產管理、變更管理結合,借此保障數據質量。然而隨著運維規模和變更頻率的增加,嚴格的流程管控也越來越難
- 于是,人們開始嘗試自動發現也取得一定效果。但自動發現存在滯后性和技術限制,且維護成本不低,實踐效果遠沒有想象美好。由于資源供應不規范,增量數據依舊得不到控制
- 今天,很多企業IT終于意識到CMDB數據問題的根源是資源供應。所以利用云管平臺、應用自動部署、變更自動化等工具保障配置數據供應的及時性、準確性和規范性可能是解決問題的根本之道。但是企業IT環境非常復雜,短期內自動化手段不可能完全解決問題
我們會發現配置管理是一項復雜工程,任何單一流程和技術都不是其成功的充分條件,要綜合運用各種流程和技術手段,而且更重要的是引入運營方法論,指導我們如何站在用戶視角設定運營指標,如何持續監測指標的達成情況,如何建立解決問題的跟蹤機制,以及如何將CMDB和其他流程、工具平臺有機結合,形成從數據供應到治理再到消費的良性數據流生態。
三、面向運營的配置管理
以終為始,設計數據模型和管理范圍
CMDB不能直接生產數據,也無法直接交付數據價值。其核心價值在于成就其他運維管理業務,用配置數據幫助他們解決實際問題。然而在建設時,我們往往埋頭死磕數據,在用戶如何使用數據、除數據外是否還需要其他條件、這些條件短期內能否具備等方面思考不足。
面向運營的管理方法讓我們轉變思路,從關注“CMDB要管什么數據”變為“CMDB如何幫助用戶成功”,并在此基礎上設計配置模型和數據管理范圍。企業級CMDB產品應具備運營特性,比如Tarsier CMDB可為每個CI屬性記錄消費場景、價值收益和重要級別。這些都是CI的“元數據”,如果無法明確,則意味著對其價值收益沒有想清楚。
基于重要性級別設計數據質量SLA
對數據消費者來說,很自然認為所有配置數據都應該準,但這不現實。IT環境在不斷變更,很多信息無法保證被及時更新。事實上,這種需求本身也并非合理。為什么必須準,如果不準有重大影響嗎?我們更精細的制定數據質量SLA,比如關鍵屬性準確率95%,重要屬性準確率80%,參考屬性不保障準確率。具備運營特性的CMDB應能記錄這些數據質量要求,并在運營儀表盤中自動呈現達標情況。
用可視化查詢語言降低數據獲取門檻
數據的可獲取性幾乎與準確性同樣重要。如果用戶無法及時得到自己想要的數據,那么數據再準也沒用。如何讓用戶快速獲得自己想要的數據?好的辦法是讓他們自己挑選和組裝數據。
據統計,在眾多配置數據查詢需求中,約85%是關聯查詢。比如查詢應用系統及其關聯的服務器、服務器關聯的網絡和存儲設備、還有更復雜的從應用到機房跨越十幾層CI分類的查詢。針對這類需求,傳統做法是寫代碼,全程費時費力、需求響應極慢且后期維護成本高昂。
為了提升數據獲取效率,CMDB應提供一種新型的、可視化的查詢語言。比如以Tarsier CMDB為代表的VQL查詢語言,能夠屏蔽代碼的復雜性,用簡單的圖形拖拽就能編寫復雜的關聯查詢規則,用戶可基于VQL自服務挑選和組裝數據,全過程減少了溝通成本、等待成本、代碼編寫和維護成本。
構建運營指標體系和運營儀表盤
良好的運營離不開量化指標。配置管理有兩類運營指標:消費活躍度、數據健康度。
- 消費活躍度是衡量CMDB效益的重要指標,該指標能告訴我們CMDB真實的數據消費情況。比如哪些CI實例、哪些CI屬性被頻繁的取用,而哪些CI和屬性從來沒有被訪問過。將這些測量結果與模型設計時確定的屬性重要性相比對,可能會發現一些有意思的現象,比如一些原本認為關鍵或重要的CI屬性從來沒有被消費過
- 數據健康度是一個指標集合,包含數據準確性、完整性、有效性三個指標。準確性是指CI數據與真實環境不一致,完整性是指CI實例或部分屬性遺漏登記,有效性是指數據不符合標準格式。數據健康度應按照屬性重要性分別統計,不應混在一起
上述所有指標應被自動化測量,并生成可視化的運營儀表盤,讓所有相關利益方能夠了解CMDB的真實現狀,指引運營團隊持續改進。
四、面向運營的IT配置管理的優勢
縮短挫折期,讓配置管理快速見效
業界CMDB的建設效果普遍不太好,項目建設初期充滿期望,之后是漫長的挫折期。很多CMDB將在此期間滯留數年之久。
面向運營的建設方法能夠有效縮短挫折期,通過站在用戶角度識別真正的運維痛點,讓配置團隊不再埋頭梳理數據,而是時刻關注用戶的成功,讓每一分努力都創造效益,而不是構建一個完美的數據庫。
降低運營成本,好鋼用在刀刃上
任何IT組織都無法不計成本的投入資源做CMDB,我們要讓已有資源發揮足夠大的價值。CMDB應能解放配置團隊生產力,通過運營實踐固化到產品功能中,快速構建運營指標體系,自動化測量各項指標現狀,并在儀表盤可視化呈現,將配置團隊從日常繁雜的事務性工作中解脫出來,讓他們有更多的精力關注配置數據價值的挖掘和推廣。



