掃一掃 | 微信關(guān)注


為了充分展示不同企業(yè)在數(shù)字化轉(zhuǎn)型過程中,對IT運維的實踐經(jīng)驗和理念洞察。廣通優(yōu)云特推出【極致案例】系列文章。
本欄目將從業(yè)務(wù)實踐和行業(yè)場景出發(fā),解析如何借助前沿技術(shù)推動業(yè)務(wù)創(chuàng)新和行業(yè)轉(zhuǎn)型,與讀者分享涵蓋金融、海關(guān)、稅務(wù)、平安城市等多個行業(yè)的成功故事。
數(shù)據(jù)中心,承載著組織的業(yè)務(wù)應(yīng)用和數(shù)據(jù)運轉(zhuǎn),猶如企業(yè)數(shù)字化的心臟。
堅實、智能的數(shù)據(jù)中心運維就像一架發(fā)電機,為各類業(yè)務(wù)、IT系統(tǒng)提供源動力的同時,持續(xù)不斷煥發(fā)新能量,降本增效。
走在信息化的前沿,銀行業(yè)的經(jīng)營和業(yè)務(wù)模式正被新興科技重塑。
追溯業(yè)務(wù)發(fā)展已有百年歷史的某國有大型商業(yè)銀行,緊抓時代機遇,不斷拓寬業(yè)務(wù)創(chuàng)新維度的同時,一直在實踐金融科技的落地。
該銀行自成立之初便專注于業(yè)務(wù)創(chuàng)新、運營高效的落地,擁有優(yōu)良的資產(chǎn)質(zhì)量和顯著的成長潛力。
隨著金融科技的深入。早年,其數(shù)據(jù)中心完成主數(shù)據(jù)中心、同城數(shù)據(jù)中心和異地災(zāi)備數(shù)據(jù)中心“兩地三中心”生產(chǎn)格局的構(gòu)建,主要負責(zé)全行信息系統(tǒng)運行維護工作。

同時,承擔(dān)著“兩地三中心”各類生產(chǎn)、災(zāi)備等百套計算機系統(tǒng)以及小型機、PC服務(wù)器等數(shù)萬臺計算機設(shè)備的運行維護,支撐著全行數(shù)萬個網(wǎng)點、上億名個人用戶、數(shù)萬億元的資金流和信息流運轉(zhuǎn)。
作為國有大行,該行的轉(zhuǎn)型之路走得比較早,但大象轉(zhuǎn)身,談何容易?
面對行業(yè)之變,其在新一代分布式架構(gòu)下的業(yè)務(wù)系統(tǒng),具有實時交易量大、熱數(shù)據(jù)體量大、事務(wù)強一致性、業(yè)務(wù)邏輯復(fù)雜等特點。
越來越復(fù)雜的系統(tǒng)、逐漸龐大的設(shè)備和應(yīng)用數(shù)量,日趨嚴格的監(jiān)管合規(guī)要求,如何全面、自主、有效、優(yōu)雅從容地進行統(tǒng)一運維管理是新時代數(shù)據(jù)中心面臨的挑戰(zhàn)與機遇。
“變則生,不變則亡。”這幾乎是各個行業(yè)長期成敗的發(fā)展法則。
銀行業(yè)的創(chuàng)新者也是類似。
中國銀行業(yè)協(xié)會發(fā)布的《中國銀行家調(diào)查報告(2020)》顯示,超半數(shù)銀行將推進數(shù)字化建設(shè)作為戰(zhàn)略重點。

- 中國銀行家調(diào)查報告(2020)圖(侵刪)
領(lǐng)先的銀行已經(jīng)為之進行了積極的探索,對于走在信息化建設(shè)前沿的銀行們,自然是不甘落后。
搭建一個基于運維視角,融合新時代內(nèi)外部技術(shù)趨勢,自主創(chuàng)新,保障高效運行,促進業(yè)務(wù)迭代,以快速恢復(fù)生產(chǎn)為第一要務(wù)并總攬全局的平臺,已逐漸成為業(yè)界創(chuàng)新共識。
廣通優(yōu)云助力其共研創(chuàng)新的一體化運維平臺采用微服務(wù)、模塊化設(shè)計思路,將運維的能力下沉PaaS平臺化,運維的場景上浮SaaS應(yīng)用化,實現(xiàn)數(shù)據(jù)中心級運維管理復(fù)雜問題的分層解耦。
推動了運維軟件從重復(fù)建設(shè)走向持續(xù)運營,通過平臺持續(xù)迭代來實現(xiàn)能力共享,讓運維的積累能夠被沉淀下來。通過服務(wù)化的方式構(gòu)建場景生態(tài),推動運維自動化、數(shù)據(jù)化、智能化、運營化的持續(xù)演進,形成數(shù)字化運維的核心競爭力。
- 運維中臺設(shè)計理念圖 -
基于此核心建設(shè)思路與理念,其數(shù)據(jù)中心建立了一個能解決兩地三中心軟硬件設(shè)備監(jiān)控、告警、故障處理、資產(chǎn)管理等運維問題,支持監(jiān)控指標(biāo)、告警數(shù)據(jù)、資源數(shù)據(jù)、資產(chǎn)數(shù)據(jù)、知識庫信息等數(shù)據(jù)的在線檢索,可處理海量運維數(shù)據(jù)并能夠持續(xù)發(fā)展的運維管理平臺。
恰如開篇所言,如果把數(shù)據(jù)中心運維比作發(fā)電機不斷供給能量的過程,那么于該銀行而言,監(jiān)控系統(tǒng)就有如發(fā)電機的引擎。
追溯該銀行數(shù)據(jù)中心信息化發(fā)展歷史進程,陸續(xù)建設(shè)了從機房動力、基礎(chǔ)硬件、系統(tǒng)、網(wǎng)絡(luò)到應(yīng)用和云計算等多種專業(yè)監(jiān)控,報警信息也統(tǒng)一在集中監(jiān)控中展示。
監(jiān)控是一切運維工作的基礎(chǔ),這點在該銀行數(shù)據(jù)中心運維的建設(shè)路上,顯得尤為重要。
傳統(tǒng)的監(jiān)控系統(tǒng)如何支持分布式大規(guī)模的部署需求?監(jiān)控覆蓋面如何拓寬至全面軟硬件系統(tǒng)?
其體現(xiàn)和傳導(dǎo)的是數(shù)據(jù)中心對于運維工作的整體管理思想框架,反哺的是新的運維管理思想和管理體制。

- (參考效果)兩地三中心部署監(jiān)控理念圖 -
廣通優(yōu)云和用戶一起,進行了運維監(jiān)控數(shù)字化轉(zhuǎn)型的探索研究,共研共創(chuàng)。
雙方共同設(shè)計的兩地三中心統(tǒng)一監(jiān)控納管通過快速監(jiān)控該銀行主數(shù)據(jù)中心、同城數(shù)據(jù)中心和異地災(zāi)備數(shù)據(jù)中心三個數(shù)據(jù)中心的數(shù)據(jù),實現(xiàn)了監(jiān)控、告警、流程、資源(資產(chǎn))、日志、可視化、報表等數(shù)據(jù)的統(tǒng)一,可在同一個系統(tǒng)中完成三個數(shù)據(jù)中心的運維工作,滿足了告警統(tǒng)一處置、資源統(tǒng)一納管、業(yè)務(wù)統(tǒng)一展現(xiàn)的管理要求。
l 大規(guī)模、強納管、高并發(fā)監(jiān)控體系
具體而言,雙方共建的統(tǒng)一標(biāo)準(zhǔn)監(jiān)控平臺,能夠及時準(zhǔn)確地采集兩地三中心所有軟硬件資源的監(jiān)控信息。實現(xiàn)了數(shù)萬節(jié)點,上千指標(biāo)的快速上報,以業(yè)務(wù)為視角的監(jiān)控體系,大大改善了該銀行的監(jiān)控覆蓋面,提高監(jiān)控準(zhǔn)確度和時效性。

- (參考效果)數(shù)據(jù)中心級的資源指標(biāo)多維度實時監(jiān)控 -
與此同時,大規(guī)模監(jiān)控系統(tǒng)還提供了多樣化的監(jiān)控方式,諸如:本地代理及遠程監(jiān)控,實現(xiàn)運維系統(tǒng)與被管對象的統(tǒng)一通訊,進而實現(xiàn)采控策略化,有效提升大規(guī)模、全方位監(jiān)控的能力的同時,也降低了運維難度,提升了運維效率。
l 全方位標(biāo)準(zhǔn)化告警能力
面對跨中心、跨系統(tǒng)、跨種類的告警數(shù)據(jù)接入和展現(xiàn)。構(gòu)建了以CMDB基礎(chǔ)圖譜為支撐,業(yè)務(wù)應(yīng)用為導(dǎo)向,智能診斷促提效,自動化預(yù)案相聯(lián)動的閉環(huán)化告警體系。建設(shè)創(chuàng)新后的IT運維系統(tǒng)可以通過以下4大特點,實現(xiàn)故障告警的標(biāo)準(zhǔn)化、精準(zhǔn)化、及時化定位:

- (參考效果)場景化告警管理高效提升故障處置效率 -
1、定位有效性:規(guī)則引擎實現(xiàn)告警的壓縮歸并、豐富定位、告警通知、告警抑制、維護期等功能,提供告警場景化管理、監(jiān)控聯(lián)動、關(guān)聯(lián)知識庫、觸發(fā)告警工單
2、告警處置效率:告警自動觸發(fā)工單,從而實現(xiàn)流程化告警操作處理,提升告警故障解決效率
3、告警失效率降低:加入告警處理的SLA機制,對告警處理的失效性進行考核
4、告警定位可視化:通過系統(tǒng)畫像以業(yè)務(wù)系統(tǒng)拓撲為視角實現(xiàn)一鍵故障診斷、系統(tǒng)性能快查等功能,并使用報表進行不同維度的運維數(shù)據(jù)分析
“IT資產(chǎn)輕松納管,運維場景快速擴建。”
海量數(shù)據(jù)資產(chǎn)下的運維場景構(gòu)建,也是該銀行運維數(shù)字化轉(zhuǎn)型的一大亮點。
通過構(gòu)建完善的IT資源管理體系,以CMDB作為大數(shù)據(jù)運維中的主要數(shù)據(jù)來源,形成以資源庫為核心的監(jiān)、管、控一體化運維管理體系,增加配置自動發(fā)現(xiàn)、自動校驗、信息傳導(dǎo)、數(shù)據(jù)治理等能力,保障配置數(shù)據(jù)的鮮活有效,同時實現(xiàn)了與人行上報數(shù)據(jù)的無縫對接。

- (參考效果)人行上報流程示意圖 -
與此同時,通過數(shù)據(jù)中心的數(shù)據(jù)采控的集中管控能力,滿足圍繞數(shù)據(jù)中心的智能化生產(chǎn)運維工作開展,實現(xiàn)跨節(jié)點、多數(shù)據(jù)中心資源統(tǒng)一采控納管。
實現(xiàn)了以配置數(shù)據(jù)為根基,以數(shù)據(jù)治理為手段,圍繞運維對象構(gòu)建配置模型的配置管理思路,將分散在各個業(yè)務(wù)及管理環(huán)節(jié)的已有數(shù)據(jù)進行接入、清洗、整合、分析和消費,實現(xiàn)運維數(shù)據(jù)的價值挖掘和場景服務(wù)以及數(shù)據(jù)支撐體系,滿足數(shù)據(jù)中心運營的精細化管理。
兩地三中心的異地部署、大規(guī)模的監(jiān)控秒級準(zhǔn)確納管、全方位標(biāo)準(zhǔn)化的告警處置能力和海量數(shù)據(jù)資產(chǎn)的盤活場景應(yīng)用。
的確,該銀行走出了一條業(yè)內(nèi)獨有的數(shù)字化轉(zhuǎn)型先進之路。
擁抱更廣闊、可持續(xù)的發(fā)展,銀行業(yè)數(shù)字化轉(zhuǎn)型需要建立完善的體制機制、推進金融科技布局應(yīng)用和傳統(tǒng)架構(gòu)轉(zhuǎn)型,并提升開放合作和生態(tài)運營能力。
在過去的數(shù)字化建設(shè)中,該銀行勇于打破固有的思維和發(fā)展模式,著眼于更長遠的科技變革。
有幸,廣通優(yōu)云與其攜手共創(chuàng)信息科技高地的建設(shè),推動其運維數(shù)字化轉(zhuǎn)型升級。
數(shù)字化業(yè)務(wù)背后隱藏著的新的信息科技藍海顯現(xiàn),我們愿陪伴更多客戶,揚帆再遠航。