湖北數產集團:智能運維賦能數字經濟,一體化平臺助力轉型
湖北省數字產業發展集團(以下簡稱“湖北數產集團”)是湖北聯投集團于2020年6月全資組建的唯一省級數字產業投資建設運營平臺,肩負著“科技創新的引領者、產業發展的推動者、城市更新的建設者、美好生活的創造者”的使命。集團秉承“政府主導、市場運作”的原則,匯集管理政府數據資產,激發數據要素價值,培育全數字產業鏈的集群生態,具有“省市區數據聯動、多業務板塊協同、本地化長效運營”的核心優勢,擔當湖北數據要素改革先行軍、數字經濟發展排頭兵,是湖北省數字經濟高質量發展的“主力軍”,推動產業轉型升級的重要引擎和龍頭企業,在數字湖北建設中發揮國有經濟戰略支撐作用。
一、數字化轉型建設不斷深化,運維面臨新的挑戰
隨著數字化轉型的浪潮席卷各行各業,企業運維體系也面臨著前所未有的轉型升級壓力。傳統的運維模式已難以充分滿足企業對高效、穩定、智能運維的需求,特別是在云原生、大數據、人工智能等技術快速迭代的當下,運維體系的智能化、自動化、數字化成為企業持續發展的重要支撐。
在當前運維現狀下,聯投湖北數產集團在楚天云、國資云承接的眾多應用系統面臨著系統架構復雜、技術棧多樣、服務調用關系繁瑣等挑戰。云原生技術的引入進一步加大運維難度,且現有的運維團隊專業技術人才儲備有限,缺乏一體化、集約化運維手段,運維壓力增加,難以滿足未來架構擴展帶來的技術挑戰。同時,集團對應用系統的高質量體驗提出更高要求,使得運維工作面臨新的機遇和挑戰:
二、構建業務管理一體化平臺,打造運維監管新體系
面對數字化轉型帶來的新挑戰,湖北數產集團攜手嘉為藍鯨共同打造業務管理一體化平臺,構建“縱向監督、橫向聯動”的一體化運維監管體系。對于現有存量應用,采用“無感接入、運維融合”的策略;對于新增系統,采用“三步走”方法,快速提升應用系統的運維能力,實現運維工作質的飛躍。
業務管理一體化平臺集IT服務臺、統一配置管理、監控告警、自動化運維等多種功能于一體,通過統一的平臺,運維團隊能更為高效地管理運維任務,減少信息孤島,提高協作效率。平臺支持自動化運維工具和運維開發框架,實現日常運維任務自動化,減少人工干預,提升運維效率與準確性。平臺具備靈活性和擴展性,支持新信創環境,且能通過API網關,無縫對接國資云、政務云、容器云及本地設備,確保功能模塊間有效協作,推動運維場景融合。
統一配置管理:建立統一配置管理系統,規范數據標準與治理;為業務交付場景提供數據配置、實例拓撲及配置自動采集服務;通過自動化技術實現配置數據的增量采集。
統一監控管理:構建統一監控系統,全方位監控操作系統、數據庫、中間件、云平臺以及業務應用;基于多層架構,全面采集、處理、分析和展示監控數據;具備自動告警功能,根據設定閾值和規則生成告警信息,及時通知運維人員。
集中告警中心:構建集中告警中心,集中處理告警信息,實現自動化分派和自愈;通過靈活的告警策略配置、多渠道通知以及深入分析和趨勢預測,降低運維成本,增強對潛在系統風險的預測能力。
IT服務管理:構建IT服務管理平臺,提供統一訪問入口,集成服務請求、時間、問題、變更和知識管理等流程;支持多渠道訪問,滿足不同角色的需求;插件商店支持功能靈活擴展,具備多種平臺能力。
此外,為確保技術人員能夠熟練掌握新系統的操作,嘉為藍鯨提供了系統的培訓,包括平臺運維培訓、產品使用培訓、腳本開發培訓與運維開發培訓等,為集團的運維工作提供有力的知識支持。同時,項目實施后,嘉為藍鯨將提供7x24小時的技術支持,確保系統的穩定運行,并及時解決用戶問題。通過建立用戶問題管理機制,運維團隊能夠快速響應用戶需求,提升服務質量。
三、業務管理一體化推動運維數字化
1、統一配置管理:構建集團企業級數據管理新體系
建設集團企業級資源管理方案,實現數據統一管理,解決了數據開放性不足、數據質量難以保障以及數據難以有效度量與復用等挑戰。以業務為導向,為各交付場景提供多種服務,涵蓋配置項管理、配置庫維護和配置審計等多個方面,保障集團IT配置信息的一致性和準確性。
目前,共設計了40+個IT資產模型對象,納管超過60個業務系統以及40+臺主機,并采集業務管理一體化平臺上的中間件和數據庫。
2、統一監控管理系統:全面提升運維效能
構建統一監控管理系統,全方位監控操作系統、數據庫、中間件、云平臺以及業務應用。基于多層架構,全面采集、處理、分析和展示監控數據。具備自動告警功能,根據設定閾值和規則生成告警信息,及時通知運維人員。
目前,監控平臺已接入嘉為藍鯨全棧智能觀測中心和阿里云兩個告警源,并監控40+臺主機,配置4類中間件、4類數據庫以及超過70個撥測任務。
3、統一告警管理:構建高效告警處理閉環
構建集中告警中心,集中處理告警信息,實現自動化分派和自愈。通過靈活的告警策略配置、多渠道通知以及深入分析和趨勢預測,降低運維成本,增強對潛在系統風險的預測能力。平臺具備告警自愈、告警分析、告警抑制、告警屏蔽、告警轉工單等功能,實現“告警精準捕獲-告警集中接入-告警快速豐富-告警高效抑制-告警主動屏蔽-告警定向派單-告警處理-告警及時關閉”告警事件全生命周期閉環,提高告警處理的效率和準確性。
當前共接入20+個系統,平均收斂率90%;截至目前共發生1100+次原始告警,有效告警轉工單100+。
4、IT服務管理:實現IT服務全生命周期管理
構建IT服務管理平臺,提供完整的IT服務管理流程和服務目錄。通過請求、事件、問題、變更、知識等流程管理服務,實現對IT服務全生命周期的管理和監控。平臺支持與自動化執行、配置管理系統、集中告警系統的數據交換和功能聯動,滿足流程功能自定義擴展需求。系統共上線8個流程,運行期間產生了20+條工單。
四、總結
通過構建業務管理一體化平臺,湖北數產集團的運維效率和質量得到提升,實現運維工作的數字化轉型。未來,該平臺將持續發揮強大的運維管理能力,幫助數產集團更好地應對各種運維挑戰。湖北數產集團與嘉為藍鯨將共同致力于推動運維管理的創新發展,不斷深化合作成果,為數產集團的數字化轉型和業務發展提供強有力的支撐。