了解最新公司動態及行業資訊
第一章總則
運維的目標是在服務異常時盡快恢復服務,保證服務的可用性; 同時深入分析故障原因; 促進和修復服務中存在的問題,并設計和制定相關方案,確保服務故障得到保障。 高效補貨。
第一條 為保證信息系統軟硬件設備的良好運行,使運維人員工作制度化、流程化、規范化,特制定本制度。
第二條運維管理的總體目標:立足根本促進發展,開創運維工作新局面。 在辦公系統運行推廣期,只有通過網絡、桌面、系統的運維,才能促進信息系統的穩定、持續發展。
第三運維管理系統適用范圍:所有運維人員。
第二章編制方法
第一條 本實施細則包括運維服務全生命周期管理方法、管理規范/規范、管理模型、管理支撐工具、管理對象、流程化管理技術等內容。
第二條 本實施細則以ITIL/ITIL/信息化項目運維為目標,以管理支撐工具為手段,以過程化、規范化、規范化管理為手段,以PDCA以全生命周期循環為提升方式,展示運維服務全過程的系統化管理。
第三章運維部職責
第一條 系統運行維護及技術支持
1)根據公司業務的推進和發展目標,負責平臺信息系統管理和數據交換策略的總體架構,應用系統的基礎支撐和其他技術開發解決方案,確保穩定性和先進性的基礎平臺。
2)負責系統基礎平臺的使用培訓和操作手冊的編寫,以及用戶在使用過程中出現的問題的溝通和解決;
3)結合項目實施,確定系統信息基礎設施和軟件數量、品牌規模、技術參數,確保項目有效推進實施。
4) 制定系統信息基礎設備和軟件操作規程、應用管理制度,并負責監督實施。
5) 系統信息基礎設備的軟件安裝、調試和初步檢查,使用培訓和維修保養。
6)協調解決系統信息基礎平臺日常運行過程中的信息安全和技術問題,確保平臺24小時安全穩定運行。
7) 負責平臺系統管理及設備安全密碼的設置、更新、保存。
8) 負責新程序、新系統、軟件改版升級的系統信息協同管理和協同數據交換策略研究。
第二條 平臺信息與技術安全
1)貫徹落實國家有關網絡信息技術安全的法律法規,會同通信管理和網絡安全監管部門,及時處理基礎研究平臺信息技術安全存在的問題,確保基礎研究平臺安全、穩定、可靠運行平臺。
2)建立信息技術安全保密制度和基礎運營平臺工作流程,落實信息技術安全保密責任制,落實“誰管、誰負責、誰負責”的原則誰承擔,誰負責”,責任到人。
3)在服務器和計算機之間設置硬件防火墻,在服務器和工作站都安裝殺毒軟件,進行硬件和技術的雙重保護,確保基礎研究平臺不受病毒和黑客的攻擊
4) 負責基礎運營平臺信息技術安全應急預案的制定和實施。
5) 構建多機備份基礎平臺信息服務體系機制。 一旦主系統出現故障或被攻擊而無法正常運行,可以在最短的時間內更換主系統提供服務。
6) 構建基礎平臺系統的集中權限管理,根據崗位職責設置人員的操作權限,設置共享數據庫信息的訪問權限,設置不同應用系統、終端、操作人員的密碼。 不同的運營商設置不同的用戶名并定期更改,運營商禁止泄露密碼。
第四章運維服務管理體系
運維服務管理體系規定了參與運維工作的各個實體,以及這些實體之間的相互關系。 相關實體按照運維服務管理體系進行有機組織和協調,根據服務合同的要求,提供不同層次的IT運維服務。
第一個運維服務管理對象
運維服務管理對象包括基礎設施、應用系統、用戶、供應商以及IT運維部門和人員。 詳情如下所示:
1)基礎設施包括網絡、主機系統、存儲/備份系統、終端系統、安全系統、機房動力環境等。
2)應用系統包括OA辦公信息系統、門戶網站等應用系統。
3) 用戶包括使用上述應用系統的用戶。
4)供應商包括基礎設施和應用系統供應商以及IT運維服務供應商。
5)運維部門和人員包括內部參與運維活動的相關部門和人員,以及提供運維服務的企業和相關人員。
第二條運維系統功能架構
根據建設單位的體系結構和業務需求,運維項目組將項目維護框架劃分為9個具體的組件,分別是:服務臺和時間管理。 工單管理、問題管理、變更管理、配置管理、工程師評估、知識庫管理、統計、系統管理等。
第二條運維管理組織架構
運維項目的運維管理結構是三層模型。 項目負責人將與乙方商討業務范圍,并將溝通結果向上傳遞。 項目總監負責項目的整體運營和維護,包括各項制度的制定和實施。 運維工程師在項目負責人的指導下進行維護工作。
第三條項目負責人
職責:負責項目業務及統籌協調。
職位描述:
1、全面負責建設單位運維項目服務計劃的制定,領導項目總監并安排項目工作,指導項目總監完成具體的維護工作,每周聽取項目總監的工作匯報,以及負責評價項目總監工作的完成情況。
2、協助建設單位完成新建工程的監理設計,指導項目負責人進行具體實施。
第四篇項目總監
職責:規劃、實施和完善信息化項目運維工作,指導網絡和數據庫維護工程師開展工作。
職位描述:
1、根據公司戰略目標,指導下屬工程師開展服務工作,確保運維工作滿足客戶業務實際需求;
2、建立并持續建立運維管理體系,優化運維流程,解決運維服務中的特殊問題;
3、規劃和提升運維工程師的專業服務能力,整體提升服務滿意度;
4、制定并繼續建立績效考核體系;
5、制定運維項目梳理應急預案體系,指導運維工程師落實;
6、提高自身專業技能,對網絡管理員、數據庫管理員進行業務方面的指導。
第五條 技術監督員
職責:應用程序和數據庫管理、數據庫性能調整和應用程序負載平衡。
職位描述:
1、技術主管不是項目常駐人員,根據項目需要提供專業指導;
2. 負責數據庫性能分析和調優,數據庫運行狀態監控,及時發現異常并快速處理。
3、熟悉數據庫技術,能實現部署調優。
4、掌握中間件的工作原理,可以實現部署優化和故障排除。
5、熟悉linux操作系統,會部署數據庫。 精通數據庫冗余、數據保護、故障恢復技術。
6、負責應用負載均衡的部署和調試。
7、負責指導數據庫工程師和管理員開展工作。
第六篇服務臺
職責:故障來電受理,文件管理。
職位描述
1、負責業務緊急呼叫的受理;
2、故障處理的發起者,同時指派維護工程師跟蹤故障處理情況;
3、進行維修故障統計、用戶滿意度統計、工作報表輸出等;
4、協助項目負責人整理、分類、保存文件。
第七條網絡管理員
職責:維護施工單位網絡系統的正常運行,解決網絡相關故障。
職位描述:
1、現有服務器、局域網、機房、配線室的日常管理和維護;
2.提出信息安全建設的相關建議,確保網絡安全;
3、確保內網光纖線路正常,局域網運行正常;
4、監控網絡系統和網絡設備的運行狀態;
5、熟悉域策略設置、DHCP、DNS、FTP服務器、NTFS權限設置等;
6、網絡部分的應用解決方案的編制和實施。
7、工作認真細致,積極主動理性,具有良好的溝通能力和團隊合作精神。
第 8 條 應用程序和數據庫管理員
職責:維護建設單位業務系統的正常運行,解決應用和數據庫故障。
職位描述:
1、監控業務系統的運行狀態,對應用程序和數據庫的性能進行監控和優化,并進行必要的調整;
2、規劃不同數據的生命周期,制定備份、恢復、遷移和容災策略,根據業務需要進行數據轉換和遷移操作;
3. 確保應用程序和數據庫系統的安全性、完整性和運行效率。
4、負責數據庫平臺整體架構及解決方案的制定與實施;
5、工作認真細致,積極主動,理性,有良好的溝通能力和團隊合作精神。
第九條終端管理員
職責:維護施工單位桌面系統的正常運行,解決終端及外設故障。
職位描述:
1、各部門筆記本、打印機、傳真機的維修;
2、為各部門人員提供筆記本電腦相關的技術支持和培訓;
3.熟練使用 Linux和WPS辦公軟件,可以熟練使用
; 只能用MS軟件制作相應的教程,培訓其他部門人員。
第十條運維服務流程
IT運維服務管理流程涉及服務臺、事件管理、問題管理、配置管理、變更管理、發布管理、服務水平管理、財務管理、容量管理、可用性管理、服務連續性管理、知識管理和供應商管理等. ,隨著運維活動的不斷深入和不斷完善,其他流程可能會逐漸獨立和標準化。
第十一條服務臺
服務臺是支撐運維服務的核心職能,與各個流程密切相關。所有管理流程都應通過服務臺為用戶提供單點聯系,解答用戶的相關問題和需求,或尋找合適的用戶支持人員
第十二條風暴管理
風暴管理流程的主要目標是盡快恢??復服務提供并減少其對業務的不利影響,確保最佳的服務質量和可用性級別。 事件管理過程一般包括事件檢測和記錄、事件分類和支持、事件調查和診斷、事件解決和恢復以及事件關閉。
第十三條工單管理
工單管理:工單是現場運維和二線保障的任務載體,運維項目根據收到的工單進行運維工作。
工單管理是工單創建、修改、查詢、瀏覽、調度、監管等模塊。
第十四條 問題管理
問題管理流程的主要目標是防止問題和崩潰的再次發生,并將未解決事件的影響降至最低。 問題管理過程包括診斷事件根本原因和確定問題解決方案所需的活動。 通過適當的控制流程,尤其是變更管理和發布管理,它負責確保解決方案的實施。 問題管理還將維護有關問題、解決方法和解決方案的信息。
問題管理是針對已經處理過的剩余問題,或者應對風暴的解決方案進行考慮的一個模塊,只是治標不治本,不是解決問題的長久之計。 根據風暴和解決方案,問題處理者進行調查、診斷并提出最終解決方案。
第十五條 變更管理
變更管理對所有基礎設施和應用程序系統實施變更。 變更管理應記錄和分類所有必需的變更,并應評估變更請求的風險、影響和業務收益。 其主要目標是在對服務造成最小中斷的情況下實施有益的變化。
變更管理是對主要資源的新增、變更、升級等運維活動進行初步審查的功能,避免這些活動對現有資源的可用性造成不必要的影響和損害; 同時,必須實現在工單表單變更后進行事后審計的功能。
第十六條 配置管理
配置管理過程負責驗證在基礎設施和應用系統中實施的變更以及配置項之間的關系是否已被正確記錄; 確保配置管理數據庫能夠準確反映現有配置項的實際版本狀態。
配置管理實際上是對所有資源進行統一管理的功能,包括對資源整個生命周期的參數或配置變更記錄的管理。管理信息主要涉及分類、型號、版本、位置、狀態、相關資料等基本信息,還包括核心參數等。
第十七條 知識庫管理
知識庫管理:知識庫是提供給運維人員的重要技術信息內容,匯集了工作中遇到的典型案例總結出的知識要點和全面實用的信息指南。 知識庫管理提供簡單易用的人機界面、快速查詢的技術手段和維護手段。
第十八條統計和工作報告
運維管理系統提供一線解決率統計、客戶滿意度統計、風暴分類匯總統計、工作報表生成功能。 風暴數據、工單數據、問題數據、配置數據、變更數據可以按照一定的格式,幫助運維管理者清晰的列出運維的工作內容。
第四章運維服務內容
第一條 服務宗旨
運維項目組提供的運維服務包括信息系統相關主機設備、操作系統、數據庫、存儲設備的運維服務,保障用戶現有信息系統的正常運行,增加統籌管理成本,并改善網絡信息。 系統的整體服務水平。 同時it運維技術,根據日常維護的數據和記錄,提供用戶信息系統的整體建設方案和建議,更好地為用戶的信息化發展提供有力保障。
用戶信息系統的構成主要可分為硬件設備和軟件系統兩大類。 硬件設備包括網絡設備、安全設備、主機設備、存儲設備等; 軟件設備可分為操作系統軟件、典型應用軟件(如:數據庫軟件、中間件軟件等)、業務應用軟件等。
服務項目范圍涵蓋的信息系統資源的關鍵狀態和參數指標:運行狀態、故障情況、配置信息、可用性和健康狀態性能指標
第二條資產統計服務
服務內容包括:硬件設備型號、數量、版本等信息統計,記錄軟件產品型號、版本及補丁等信息統計,記錄網絡結構、網絡路由、網絡IP地址統計,記錄綜合布線系統結構及布局等。統計輔助設備記錄
第三網絡、安全系統運維服務
網絡系統的運維管理是從網絡連通性、網絡性能、網絡監控管理三個方面來實現的。
設備基礎性能測量:CPU和內存占用檢測; 設備日志查看; 設備 SNMP 狀態; 測試 Ping 和其他工具的連通性; 網絡安全策略應用是否正常;
帶寬流量實時檢測; 檢測網絡拓撲鏈路狀態; 網絡數據包流量異常; 檢測 Dos 和 ddos?? 等網絡攻擊; 檢測線路錯誤分辨率和丟包率;
第四條 主機及存儲系統運維服務
為主機和存儲系統提供的運維服務包括:主機和存儲設備日常監控、設備運行狀態監控、故障排除、操作系統維護、補丁升級等。
第五條 數據庫系統運維服務
提供的數據庫運維服務包括主動的數據庫性能管理,這對系統運維非常重要。 通過主動的性能管理,您可以了解數據庫的日常運行狀態,找出數據庫性能問題發生的位置,有針對性地進行性能優化。 同時密切關注數據庫系統的變化,主動預防可能出現的問題。
1、進行監控管理
內容包括: 數據庫基本信息:文件系統、碎片、死鎖、CPU占用率高或時間長的SQL語句。 表空間使用信息檢測; 數據庫文件I/0讀寫狀態; 連接數監控; 數據庫竊聽操作狀態檢測; 檢查日常數據備份和數據同步是否正常; 報告日志檢測; ; 測數據庫后臺進程; 檢測數據庫對象的空間擴展;
2.數據庫維護
也就是說,數據庫創建后的工作稱為數據庫維護。 包括備份系統數據、恢復數據庫系統、生成用戶信息表、授權信息表、監控系統運行狀態、及時處理系統錯誤、保證系統數據安全、定期修改用戶密碼等。
三、需求驗收流程
1)產品組提出業務需求。
2)開發團隊分析需求,將需要修改的內容反饋給運維團隊
3)運維組對需求進行分析和分類,包括變更、升級、維護數據庫等操作。
4)DBA將方案反饋給運維部審批,反饋風險評估結果。
5) 經運維部門領導審批后,將方案報研發部門領導審批,反饋風險評估結果。
6) 經研發部門領導批準后,DBA實施變更方案。
7)變更完成后,讓開發組協助驗證變更結果,同時測試組對測試功能進行驗證。
8)開發組驗證數據無誤,測試組驗證正常,DBA歸檔需求。
第六條 中間件運維服務
中間件管理是指對中間件如、ngnix等進行日常維護、管理和監控,增強分析和解決中間件平臺干擾的能力,保證中間件平臺持續穩定運行。 中間件監控指標包括配置信息管理、故障監控、性能監控。
第七條 終端及周邊運維服務
負責終端PC、筆記本、工作站的操作系統、應用軟硬件的維護,解決用戶在應用過程中遇到的問題并提供簡單培訓,完成復印機等其他外設的故障排除。
第五章應急服務響應措施
運維項目組制定了詳細的應急預案,整個過程嚴謹有序。 但是,在服務維護過程中,無法完全避免意外情況的發生。 我們會詳細分析項目實施中的突發性風險,但對于各種突發性的風暴,我們都設計了相應的預防和處置措施,并提供了完整的應急處理流程。
第一條 應急預案實施的基本程序
二次風暴應急響應策略
1)值班人員做好應急風暴監測工作。 對于突如其來的風暴,要認真分析,準確判斷故障發生的數據域,并負責跟蹤風暴直至結束。 對于非運維中心的故障,應第一時間通知負責人赴現場處理,密切關注風波過程和進展,做好處理工作登記并向領導匯報。
2)正常情況下,要求值班人員在15分鐘內確認風暴。 如果是正常的風暴,應該按照風暴進程進行調度; 否則,要迅速啟動《應急預案》,嚴格按照《應急預案》規定的步驟實施應急處置,并及時向上級報告,掌握實時處理情況。
3)加工過程中,如有其他部門需要到現場支持加工,應及時向上級領導部門報告,協調溝通,并盡快聯系技術工程師或廠家技術支持,到現場協助處理。
第六章 服務管理體系規范
第一次服務時間
1) 設立熱線電話,專人值守,在5*8小時工作時間內回答內部服務請求,并記錄服務臺處理結果。
2)非工作時間設立聯通熱線電話,專人7*24小時接聽,用于解決內部技術問題,通過7*24小時機房監控,解答機房突發事件報告人員。
3)服務響應時間:
故障等級
響應時間
故障排除時間
I級:這是一個緊迫的問題; 其具體現象是:系統崩潰導致業務停止和數據丟失。
10分鐘、30分鐘
內部提交失敗處理
計劃
3小時內
II級:問題嚴重; 其具體癥狀為:部分組件出現故障,系統性能有所提升但仍能正常運行,不影響正常業務運行。
10分鐘、30分鐘
內部提交失敗處理
計劃
6小時內
Ⅲ級:問題較嚴重; 具體癥狀是:
10分鐘、30分鐘
出現系統錯誤或警告,但業務系統可以繼續
內部提交失敗處理
12小時內
繼續運行而不影響性能。
計劃
IV級:這是一個普遍的問題; 其具體現象是:
10分鐘,2小時
系統技術功能、安裝或配置咨詢,或
內部提交失敗處理
24小時內
他似乎并沒有影響預約服務的業務。
計劃
第二條行為準則
1) 遵守用戶規章制度,嚴格按照用戶相應規章制度行事。
2) 與用戶運維系統的其他部門和環節配合,密切配合,共同組織技術支持工作。
3)遇有疑難技術、業務問題和重大突發事件,及時向負責人報告。
4) 現場技術支持應精致、著裝、文明、談吐樸素。 接電話要文明禮貌,語言清晰it運維技術,語氣謙虛。
5)遵循保密原則。 對依托單位的網絡、主機、系統軟件、應用軟件等密碼、核心參數、業務數據等負責保密,不得隨意復制傳播。
編碼: