了解最新公司動態及行業資訊
關于作者
四川IT公司總工程師李立峰。
福建IT公司數字化運維研發團隊負責人彭華生。
隨著聯通互聯網、大數據、云測算、人工智能等數字技術的快速應用,期貨公司正圍繞“提升客戶體驗、加速商業模式創新、提升能源”的核心價值創造加速數字化轉型。和運營效率”。對于資本市場而言,數字化轉型是一場以金融科技創新和技術能力為核心的競爭。金融科技戰略是通過數字技術賦能公司的業務運營、運營管理和商業模式轉型。在實踐中,技術線需要圍繞公司轉型戰略構建可持續的IT能力體系,以螺旋方式推動IT能力的持續提升。,
在推進中信期貨數字化轉型的過程中,信息化部積極推動組織、流程、場景、技術平臺的數字化轉型,更好地實施金融科技戰略。結合產業期貨在IT運營數字化轉型中的探索和實踐,本文重點介紹了數字化運維能力建設的經驗,提出并分享了一種“OPSP+OADS”的IT運營數字化轉型方法。
一、概覽
1、圍繞公司的核心價值觀遞歸交付價值
數字化轉型是一個自上而下逐步細化的系統工程。有序推進數字化轉型,要瞄準期貨公司數字化轉型的核心價值,“提升客戶體驗,加快商業模式創新,為經營增能增效”。創造逐漸從公司傳遞到各條線部門和執行團隊的變革價值體系。我們覺得這種價值創造的傳遞過程是一個“遞歸傳遞”的過程。“遞歸傳遞”的方法來源于計算機的“遞歸算法”,即將整體問題分解為規模縮小的相似問題,然后逐步解決遞歸調用。遞歸算法的關鍵在于,整體目標的實現是不斷分解,通過具有相同目標的細分方法來實現的。將價值轉移應用到數字化轉型中,需要采取“統一頂層規劃設計,功能性腰線分布式推廣”的策略。
在數字化轉型戰略規劃層面,自上而下從公司角度統籌規劃,確保資源安全;在執行層面,為了提高敏捷性,需要根據公司的愿景和核心價值鏈,引導各個職能腰線,細分部門的愿景和價值主張,然后采取自下而上的策略(解決分治任務),遞歸分解為具體的業務生產經營管理流程。在評估數字化IT風險管理體系時,我們按照從公司到IT,再到IT到運維的流程,總結出變革的關鍵詞和運維的價值創造。
為確保數字化轉型的有效實施,我們總結了“連接、數據、賦能”三個數字化轉型關鍵詞,指導數字化場景的實現。其中,連接是指在公司內在線構建一個實時交互的多角色協同網絡,包括人、軟件、硬件、機器人等;通過在線數據分析,有效控制協作網絡中的諸多連接,讓管理者更好地感知協作效率和可能的運營風險,協助管理決策,讓企業更好地感知客戶體驗、業務運營,快速響應業務需求; 人們既是協作網絡的設計者,也是參與者,
圍繞期貨公司的價值創造“提升客戶體驗、加速商業模式創新、提升運營效率”并遞歸傳遞給IT,我們認為IT團隊應重點打造以下六大能力:
要將IT價值進一步遞歸傳遞到IT下的產品、開發、測試、運維等功能領域,需要圍繞上述六大IT能力創造價值。以運維最后一道防線為例,可以轉化為圍繞“提升IT風險防護能力”、“加快業務交付速度”、“提升IT運營服務質量”、“提升IT運營服務質量”四點。改善客戶體驗”以推動 IT 風險管理。技能建設。
2、構建“OPSP+OADS”數字化轉型途徑
從我們以往的數字化實踐經驗來看,數字化轉型的運營管理框架是由“組織()、流程()、場景(場景)、平臺()”組成,從公司系統、部門系統,到團隊/集團系統。它由四個部分組成(見圖1),我們簡稱為OPSP。在OPSP的系統架構中,組織重點圍繞組織文化、組織架構、崗位設置、個人能力等進行數字化管理能力建設。通過數字化思維重構流程,工作流程、線上系統規范、管理領導、協作模式、資源配置等,場景是連接線上工作“人、事、時間、協作、環境” 實現能源的提升和效率和智慧的積累。需要建立有效的技術控制機制,確保在合規和風險控制的基礎上,提高業務和運營管理的效率。該平臺是支持組織、流程和場景數字化的技術基礎。
圖1:OPSP數字操作系統架構
“客戶服務、連續性保障、快速交付、生態擴張、IT服務、運營協同”技術線的六大IT能力是一個螺旋式的持續改進過程,以應對外界不斷變化的復雜性和不確定性. 能夠在高速行駛期間更換車輪。為保證IT能力建設方向的準確性,需要建立可衡量的變革績效指標,引導職能領域保持統一方向。因此,我們以“在線()、自動化()、數字()、服務()”作為評價維度來衡量場景數字化改造的成熟度(見圖2)it運維,簡稱OADS )。
其中,“線上”強調線下工作的線上化,輸出為落地數據資產;“自動化”強調人機協作,機器代替或協助人做重復性、操作性、規律性的工作;“數字化”強調利用數據資產的變現,即更全面、實時的“洞察、決策、執行”能力;“服務為本”強調技術的開放和能力的輸出。以OADS為中心,在管理和平臺建設方面,我們要求團隊通過迭代的方式不斷梳理和豐富工作場景,通過不斷引入或迭代更先進的平臺,逐步提升場景OADS的水平,
圖 2:OADS 的數字化轉型績效評估維度
二、“OPSP+OADS”的探索與實踐
技術系統和方法的數字化轉型在不同領域有著相同的目標。數字化轉型涉及方方面面,包括完善數字文化、構建敏捷組織、加強數字驅動意識培養、人才培養、技術平臺建設等。本節重點介紹使用技術平臺支持數字化轉型的實施,并以在技術平臺上實現運維為例,介紹“OPSP+OADS”的方式。在IT運維、測試等不同領域的數字化轉型過程中,我們發現不同領域的數字化轉型在技術平臺建設上的目標是一致的,即公司“ 價值主張以遞歸的方式傳遞到技術線,然后從技術線傳出。運維、測試等具體領域能力建設,借助數字思維“連接、數據、賦能”三大關鍵詞,構建“組織、流程、場景和平臺”。支持以“線上化、自動化、數字化、服務化”為場景成熟度評價標準,支持公司客戶體驗優化、業務敏捷創新、運營管理精益高效,迎接數字化挑戰與機遇。運維、測試等具體領域能力建設,借助數字思維“連接、數據、賦能”三大關鍵詞,構建“組織、流程、場景和平臺”。支持以“線上化、自動化、數字化、服務化”為場景成熟度評價標準,支持公司客戶體驗優化、業務敏捷創新、運營管理精益高效,迎接數字化挑戰與機遇。運維、測試等具體領域能力建設,借助數字思維“連接、數據、賦能”三大關鍵詞,構建“組織、流程、場景和平臺”。支持以“線上化、自動化、數字化、服務化”為場景成熟度評價標準,支持公司客戶體驗優化、業務敏捷創新、運營管理精益高效,迎接數字化挑戰與機遇。
1、數字化運維概覽
面對VUCA復雜的數字化運維世界,運維面臨著如何支持公司在高速行駛中換輪的挑戰。一是讓“相對穩定、更準確可預測的場”演化為更適合、更可持續的數字時代。第二個是適應和授權企業變化的能力,以不斷探索、創新、管理不確定性并保持敏捷。有效落實“提升IT風險防護能力”、“加快業務交付率”、“提升IT運營服務質量”、“提升客戶體驗”四大價值觀,需要從系統架構、流程機制入手、組織能力、平臺建設、
1)用OPSP構建數字化運維系統
基于OPSP的數字化運維系統能力框架包括四點(見圖3)):
圖 3:基于 OPSP 的運維能力框架
2)以OADS推動數字化運維系統成熟
基于OADS方法論的運維場景成熟度評估是為了適應機器和系統架構復雜性的不斷變化,包括四點:
結合OADS成熟度方法,我們圍繞“人、事件、時間、協作、環境”五要素,梳理了221個運維場景子項(見圖4))。從動作上看,場景主要包括:動亂應急響應、變更發布、服務管理、監控處理、巡檢操作、值班管理、數據操作、配置管理等。場景從四點比例判斷各個階段成熟度的“線上化、自動化、數字化、服務化”。
圖4:運維數字化場景成熟度圖
確保數字化運維的正確方向,所有場景的落地都需要建立在運維四大核心價值的創造之上。讓我們專注于有限的資源做更多有價值的事情。例如,圖 5 以“提高 IT 風險防護能力”為中心。“本次價值創造的場景圖。圍繞場景圖,流程總監帶頭優化流程機制和操作流程,應用運維優化業務連續性保障的可觀察性和應急保障能力,開發和運營運維研究團隊落地場景的運營推廣,
圖5:圍繞“提升IT風險保障能力”價值的運維數字化場景圖
2、數字場景示例:應急管理場景
運維場景是每個運維團隊積累的寶貴知識。不同企業的運維團隊場景不同。這些場景融合了團隊在組織、流程和平臺方面的智慧。數字化運維需要用“連接、數據”、“賦能”的數字思維重新場景化運維沉淀的智慧。以IMS(風暴管理)應急管理場景為例,它是我們數字化運維場景中跨越所有時間段的運維場景之一,是“提升業務連續性價值”的關鍵舉措. 隨著新技術的引入,業務邏輯越來越復雜,軟件迭代率的提高,以及日益嚴峻的外部形勢,影響業務連續性的激勵因素越來越多。我們用魚骨圖來梳理影響業務連續性的激勵因素(見圖6).
圖 6:影響業務連續性的激勵措施剖析
基于以上復雜的影響因素,我們構建了應急管理場景。該場景由故障預防、故障檢測、故障響應、故障定位、故障恢復、審查改進六個環節組成。整合應急協調組織、應急流程、“監督、控制、分析”平臺能力,通過“數據、連接、賦能”的數字化思維構建應急響應場景。
圖 7:故障管理閉環循環
1)用“數據驅動”重塑緊急情況
①數字感知提高可觀察性
故障發生后,運維專家需要必要的信息來提高可觀察性,協助專家進行應急決策。
完全數字化的業務和系統狀態感知看板可實現緊急洞察。提前建立應用系統主要運行指標和細分運行指標的實時數據,包括:關鍵時刻的系統狀態、業務性能狀態、業務日志狀態、組件狀態、依賴狀態、基礎資源狀態、前一天的變化信息狀態、系統缺陷列表信息、相關移動性指標等指標信息。業務和系統感知的數字看板將成為我們應用系統運維的標準輸出。
同時促進相關上游和下游系統的同時分析。關聯業務一般包括上下游業務和后端渠道影響兩類。兩種方法用于技術實現。一是提前規劃關聯系統運行狀態的數據可視化看板;另一種是建立協同在線任務。拉起IM應急群,將需要確認分析的信息推送給上下游領導。根據CMDB關系數據獲取系統的上下游關系。
感知客戶和行業動態。提前搭建業務動態信息的客戶反饋渠道和在線數據采集能力。技術實現包括在應用系統或客戶端減少客戶反饋信息功能,在線匯總客戶服務反饋、IT服務臺、終端撥號測試工具、現場客戶端。驗證等信息,并在線整合相關信息。
②不斷提升數字化流程建設能力
往年發生異常后,主要依靠運維專家的經驗,以及現場IMS主管和值班主管的臨時決策,推動故障恢復。生產故障發生后,應急現場高度緊張,經驗驅動形式容易出現關鍵步驟遺漏、協調不力、執行不力等風險。建立數字化應急管理場景,首先是處置流程在線化,即通過最佳實踐,步驟固化在線化,組織(承辦和配合人員)、流程(處置流程機制)、平臺(監控發現、自動化)是集成的。操作、數據看板等),通過人工、數字等方式降低TTR。二是數字化效率和在線應急場景,實現檢測持續時間(MTTI)、平均故障響應時間(MTTR)、平均故障定位時間(MTTK)、平均恢復時間的數字化從故障(MTTF)到實現IMS應急響應的效率。可觀察的。
同時配合實戰訓練,可以觀察到應急情況,是否可以圍繞MTTI、MTTR、MTTK、MTTF設置處置時限,手動提醒超時環節,幫助值班主任和前線線路運維構建故障處理的緊迫性,做到以實戰練習處理技巧。最后,數據驅動不斷提升,引入機器人監督和處理事件,事后評估提示應急效率分析。
2)在線“連接”人物、事件、時間、協作和環境與場景
場景設計結合用戶旅程、客戶價值主張、設計思維等方法,圍繞人、物、時間、協作、環境五要素生成解決方案。具體要素如下:
3)平臺“賦能”運維專家應急響應
要有效減少應急管理過程中TTR的時間,需要通過工具平臺,夯實機制,優化操作流程,培養人員能力,賦能運維專家。該平臺使專家能夠專注于以下項目:
①人機協同,讓應急專家與小事分離
目前大部分故障需要多個團隊共同處理,不同級別的運維人員也會造成戰機延誤。因此,我們要求在確認故障后,按照“先申報后處理”的程序進行。在場景中,我們將在線進行申報。申報后,風暴機器人將從CMDB獲取故障涉及的運維、研發、測試、值班主管、IMS主管等利益相關方,手動通知,并圍繞故障生成協同組。,并將故障處理信息實時推送到協作組。機器人的引入,讓應急人員1分鐘內發布故障信息,提升并行處理效率,
②“數據+機器人”建立平臺管理模式
往年應急管理中,現場管理主要以值班主任和職能主任為主。很容易錯過事情。有必要將管理方法集成到平臺中。例如,以減少故障檢測管理為例,目前主要依靠提高監控覆蓋率和增加上報響應時間。一方面,構建監控和報告覆蓋的數據運營,包括事后回顧、跨團隊、跨系統垂直排名等;另一方面,實時監測監測風暴響應的及時性。由于不及時接受和監控而導致戰斗機延誤的風險。
③工具賦能定位與恢復
數字化提高了應急計劃的有效性。從場景、預案、策略、操作序列的思路,構建在線應急預案工具,引入樂高式可拼裝應急策略、應急機器人等能力,解決“內容多、難匹配,不保存”在之前的WORD版計劃中。和其他問題。
提高問題定位效率的工具。使用業務運營看板、統一日志工具、自動化巡檢、最小粒度可用性看板等工具輔助定位問題,特別是在出現復雜故障時,相關方可以使用工具并行分析,避免集中在部分專家身上。
提升應急溝通效率:通過線上規劃策略,提升應急溝通效率,如當業務影響滿足監控和報告要求時,主動通知安全團隊進行監督報告it運維,通知客服和業務部門制定客戶說明,建立行業動態的溝通渠道,實現在線反饋,由指定團隊實施。
總體而言,在數字化應急管理場景下,圍繞OPSP構建了崗位角色、工作流程、操作流程、工具平臺等,并落實了OADS四個指標中“線上化和數字化”兩個成熟度等級. 維度建設,在“自動化”成熟度維度,主要引入機器人加強協作。下一步將在生產系統和機器上加強人工操作,引入智能手段搭建機器人陣地,讓機器人在現有的“重復”中發揮作用。在應急響應的基礎上,做更多“具有挑戰性”和“復雜性”的決策和執行層面的工作。
三、數字化轉型技術平臺建設方法推廣展望
綜合前面的例子,我們認為在數字化轉型的技術體系中,除了技術線之外的其他中后臺運營線也可以借鑒“OPSP+OADS”的方法,即結合核心價值公司轉型的遞歸傳遞方式將公司的價值主張傳遞到你所在的職能線,根據用戶旅程、客戶價值主張、精益創新、設計思維等工作方式重構現場工作場景。在推進數字化場景的過程中,以“OPSP+OADS”為方法論,以“連接、數據、賦能”三個關鍵詞指導具體措施,構建線內數字化轉型框架模型,
作者:李立峰、彭華生
來源丨公眾號:上海證券交易所技術服務(ID:SSE-)
社區歡迎技術人員的貢獻。提交電子郵件:
更多精彩內容
社區最后一期直播【話題接力丨云原生下 SRE 的演進】將于 6 月 8 日晚 20:00 播出。社區邀請杭州聯通SRE架構師——石俊定、B站基礎設施部SRE系統負責人劉昊齊聚云端,希望通過匯集研究,為大家提供云原生SRE演進的參考和啟示兩位 SRE 專家的成果和實踐經驗。把下面的鏈接復制到陌陌,可以用小程序觀看~
直播地址:
添加直播助手陌陌(),還可以獲得加入SRE主題交流群等更多福利~
關于我們
社區是圍繞AIOps的企業級專業社區。資深大咖,技術干貨,每晚推送優質原創文章,每日在線技術分享,每月線下技術沙龍,季度&DAMS行業會議。