掃一掃 | 微信關注
隨著全球數字化轉型的深入,數據作為新型生產要素已成不爭事實,其中,我國率先將數據列入核心生產要素范疇并大力推動數字經濟的發展。《“十四五”國家信息化規劃》等國家政策明確提出,到2025年,數字中國建設取得決定性進展,數據要素價值將充分發揮,數字經濟高質量發展,數字治理效能整體提升。
而管理著企業各類IT資源數據的運維,屬于數據密集型工作,在保障業務連續性方面離不開運維數據有效治理的支撐。但運維數據使用現狀卻常常出現“運維數據質量不一、價值不顯、缺乏抓手”等反饋。廣通優云基于在金融、政府、央企、能源等20多個行業100+核心頭部客戶的運維數據治理生產實踐沉淀,不斷剖析運維數據治理的核心價值,切入運維數據治理過程中的痛點,探索運維數據治理的體系和有效建設方法論及路徑,希望能夠帶來新的思路。

*以下內容為優云運維數據治理專場直播內容整理
本文內容索引:
1、運維數據治理發展及挑戰
2、運維數據治理體系及方法論
3、運維數據治理服務化運營

回顧IT運維的發展歷程可以發現,其經歷了人工運維到專業工具運維再到當前的運維數字化階段,在運維能力、運維技術和運維工具等維度不斷豐富和快速迭代,運維的生產實踐也越來越依賴于運維數據的支撐。而另一方面,隨著國家《“十四五”國家信息化規劃》等綱領性文件的出臺,也逐步明確了數據價值的重要性。信通院在發布的IOMM標準中,對企業數字化轉型的一個核心評估維度也是企業的“數據價值化”建設能力成熟度。 
運維數據治理的核心價值/圖
因此可以看出,無論是從國家政策及行業發展層面,還是企業對自身運維工作的支撐,都提出了對數據形成從歸集、分析、應用到開放的一體化數據管理要求。運維數據作為數據治理中重要的治理域,是運維數字化轉型的基石,應當充分發揮運維數據的價值,為運維數字化轉型賦能。在此趨勢下,運維數據治理貫穿企業組織業務產品的開發、部署、上線、運營整個生命周期,然而在此過程中,也存在著許多挑戰:在現實落地中,運維數據治理源頭異構冗余、難以整合統籌、質量不一不可信和數據難分析、難共享和數據安全缺乏管控機制,建設收益見效緩,難以發揮運維數據真正的價值。
![]()
那么,面對這些困點,運維數據治理又該如何破局呢?數據治理核心目標是解決數據質量差和消費難的問題,基于此目標需要構建運維數據治理體系,摸清運維數據的對象范圍,明確運維數據治理的定位,并從運維的人員組織、制度流程、支撐能力等管理方面做統一建設管理。
1、運維數據治理范圍
進行運維數據治理的前提需要明確運維數據的對象范圍,構思需要實現的運維數字化場景,以終為始,梳理企業組織運維數據資產,并進行歸類統籌。根據數據面向的維度和來源不同,我們根據實踐總結,可以把運維數據大體分為以下8個大類:
業務類數據:針對應用業務類關鍵指標數據;
指標類數據:面向各類資源的運行動態信息數據;
日志類數據:面向各類資源的運行、操作相關日志數據;
告警類數據:面向各類資源運行告警信息;
資源類數據:面向企業IT資源信息的數據;
作業類數據:面向各類自動化作業任務操作數據;
知識類數據:面向運維知識沉淀數據;
流程類數據:面向流程工單數據。
2、運維數據治理四大基石
在落地思路方面,廣通優云基于服務國內100+頭部企業客戶的經驗沉淀,重新總結提煉了運維數據治理建設全流程中遇到的各類挑戰,提出了「治理體系」+「能力平臺」兩大抓手并重的運維數據治理實踐方法論,具體可涵蓋數據保障、數據標準、數據質量、數據支撐四大基石,通過數據保障、標準和質量等運維治理體系形成數據的標準化管理,配合數據支撐平臺對數據的加工處置,實現數據的可見、可用、可運營、以及可消費。

運維數據治理四大基石/圖
1)建立運維數據組織、流程和協同保障機制
在運維數據治理工作開展初期,需充分了解企業組織運維及業務概況,根據組織現有架構,結合運維數據治理體系中對組織架構的要求,對現有組織架構進行分層設計,形成符合當前組織狀況的運維數據治理組織,明確管理指責,降低協同成本。

運維數據治理組織保障/圖
與此同時,需要圍繞數據的接入、申請、使用、評價等各個環節,設計不同的運維數據管理制度與流程,通過標準化的流程,形成跨團隊的協作機制,減少部門墻和團隊墻的問題,達成高效的團隊運作。
2)統一運維數據治理標準規范
確立了組織和基本的協同流程工作后,為了規范對數據的統一理解,促進數據共享,統一運維數據治理過程中對數據的定義與使用一致性,需要進行數據標準化的工作。通過相應的標準化制度以及指導文件,后續形成規范化的運維數據治理動作,從源頭形成有質量的數據。為后續的數據接入、整合、標簽化、處置、消費等一系列的數據動作提供有效前提。

運維數據治理標準規范/圖
3)構建運維數據質量度量體系和管理辦法
運維數據質量管理是運維數據治理工作的核心,通過運維數據質量的有力把控,才能讓數據可用、好用,發揮真正的價值。運維數據質量管理應聚焦有效資源,圍繞組織、流程、平臺三位一體開展,構建嚴格考核機制。

三位一體數據質量管理辦法/圖
組織層面,通過設定質量評價及考核體系,形成KPI;流程層面,形成標準化的流程流轉機制,包括定期的總結分析和優化;平臺工具層面,通過技術能力進行數據質量的檢測,提供檢測手段,共同構建三位一體的數據質量管理方法。
從考核對象、考核指標、考核支撐、考核執行四個方面落地,形成運維數據治理質量考核的閉環。
4)搭建運維數據支撐中臺并統一運維服務
治理體系的搭建為后續運維數據治理工作奠定了基礎,而運維數據價值的煥發同樣離不開技術工具的支撐。工具側,需要基于企業數據治理實施的戰略規劃,借鑒數倉理念,提供集數據接入、處置、分析、服務為一體的運維數據管理能力,并向上為運維應用場景提供數據及分析支撐。
運維數據中臺/圖
通過敏捷高效的大數據技術平臺,實現生產運維過程中所產生的8大類運維數據的統一集成存儲;針對數據服務需求對源數據進行數據加工,生成對應的數據服務模型,并通過開放訪問授權,提供統一對外數據服務輸出,同時針對不同數據消費需求場景形成多個數據集市,為上層運維數據消費提供可靠數據源,形成運維數據治理的中臺化支撐能力。

通過深入行業多年的實踐,我們發現許多企業用戶真正關心的點在于運維數據治理的價值該如何體現?前面提到,運維數據治理的核心價值是讓運維數據更好用,用得更好,前者與數據質量相關,后者則與數據應用場景相關。

運維數據治理服務化運營/圖
因此,運維數據治理要直擊實際問題,以應用場景為驅動,在海量運維數據中將場景需要的數據做提取、加工、分析,形成數據服務和數據產品,供應用場景消費,最大化數據價值。下面將從2個典型場景來舉例說明:
構建運維數據地圖
通過對元數據統一管理,形成“技術元數據”、“業務元數據”、“操作元數據”分類,梳理數據關聯并以可視化的數據表達方式,展現數據與數據之間的詳細血緣關系,能夠有效支撐各類運維場景需求。
支撐多維度告警可視化
通過應用系統多維度監控指標、資源配置數據及實時告警數據的整合,形成業務系統端到端的告警可視化展示場景。捏合各運維團隊通過一張圖看到應用系統從業務、進程、中間件、數據庫、操作系統、主機、網絡之間的關聯關系、數據調用關系和告警影響分析,快速定位根告警和影響程度,為后續故障分級、快速定位、及時處置提供數據支撐。我們回顧運維數據治理建設的體系方法論和實踐應用場景,不難發現運維數據治理是一項復雜的工程,它是涉及到技術與管理的組織戰略型工作。借鑒行業內成熟度的運維數據治理方法,將有助于運維團隊提前認識到運維數據建設過程將面臨的痛點,少走彎路,提升運維數據管理的成效,讓運維數據活起來。下一講,我們將圍繞真實企業案例,分享如何高效落地運維數據治理的實操。