了解最新公司動態及行業資訊
關于作者:
勤智(上海)科技有限公司區域項目總監韓玉強,擁有9年IT行業從業經驗,在IT運維產品實施和項目管理方面擁有豐富的經驗。
青海省濟寧港始建于1892年,是世界第七大港,也是我國第三大外貿口岸。大港區的組成。現有員工24000余人,碼頭15個,泊位72個。
技術支撐平臺建設目標
信息化是港口建設的有力支撐。南京港集團仍然高度重視信息化建設。先后建成了先進的光纖系統和無線網絡;建立EDI中心、生產指揮中心和貨運信息平臺;建成生產管理、船舶信息、財務管理、資產管理、人力資源管理、設備管理、物資管理、工程管理8個學科數據庫;實現港口業務與管理的數字化、網絡化、一體化,以持續的技術創新打造港口核心競爭力。
為保障信息系統的正常運行和維護,需要構建以系統管理為核心的技術支撐平臺,產生“以技術手段和監控工具為支撐,以流程管理為核心的”即以IT服務管理為核心,以滿足業務需求為目標的運維管理框架。
2015年,上港集團公開招標選用勤智一體化智能運維管理系統,完善了上港集團IT綜合運維管理平臺。一期運維平臺建設將全面監控上港集團骨干網的IT基礎設施和業務系統,通過網絡拓撲圖、設備性能視圖、機房視圖、設備告警視圖、業務系統視圖。 IT資產和業務系統的運行狀態,及時發現設備故障,從被動運維轉變為主動運維。
需求分析
隨著虛擬化平臺的大規模上線,機房的升級改造,大量硬件服務器的采購和激活,機房的電力環境需要進行改造和綜合監控生成虛擬化拓撲,快速定位虛擬化故障;需要對服務器硬件進行中央監控。 2017年,上港集團決定從高效利用資源、提高工作效率、及時發現和解決問題的角度對勤智統一監控運維平臺進行升級改造,開展運維平臺二期建設.
1)對現有監控系統進行升級擴容,重新規劃部署結構,方便各個分支的擴展;
2)依托監控平臺,實現對上港集團虛擬化平臺的綜合監控;
3)依托監控平臺實現帶外服務器的硬件監控;
4)機房電力環境改造,納入綜合監控系統。
解決方案亮點
通過現場需求考察,勤智決定采用分布式部署的方式對監控系統進行平滑升級。新的監控系統減少了機房的動態環境監控模塊、虛擬化監控模塊和服務器硬件監控模塊。分布式部署方式解決了單機部署的擴容困境,可根據后續擴容需求靈活擴容子采集器。分布式部署可以實現統一管理、統一檢測、統一報警、統一IT基礎設施。處理、統一報表數據管理,實現人員統一管理、統一登錄。據悉,平滑升級可以保證監控資源和歷史數據的完整性,防止重復添加。
1)部署機艙動態環境檢測系統,與監控系統集成,實現一體化監控。綜合內容包括電力監控、空調監控、溫度監控等性能顯示和報警統一顯示。
2)添加服務器硬件監控模塊來檢測服務器硬件組件。檢測項目包括:吊扇空閑速度、內部機箱和CPU機身溫度、電源電流、電源開關狀態、CMOS電池容量、CPU、磁盤、內存、RAID卡等硬件狀態。
3)增加虛擬化監控模塊,對客戶的虛擬化系統進行綜合監控。手動發現虛擬化平臺集群、虛擬主機、虛擬存儲和虛擬機,手動生成虛擬化拓撲,提供TOPN和虛擬化資源統計報表。
4)預留分布式采集,方便后期分支擴展。主服務器自帶統一門戶,可實現人員和資源權限的統一管理和統一登錄。
運維平臺的價值
通過兩期IT綜合運維管理平臺的建設,寧波港集團構建了智能化、一體化的運維管理體系,完善了可視、可預測、可衡量的主動運維管理模式。顯著提高運維服務的效率和質量。
1)構建先進的運維管理體系:通過一體化的監控運維平臺,構建統一的集中管理系統、統一的數據處理和解釋、統一的報警平臺。統一的數據處理和解釋,擺脫舊的監測模式和風暴現狀,在新的監測平臺中集中實施,通過統一的解釋界面突出顯示。統一報警平臺,所有報警都在監控管理監控平臺中列出,通過郵件、郵箱、桌面客戶端統一報警。
2)搭建IT基礎資源全面監控:在集團外網搭建一體化平臺,實現對主機、存儲、網絡、應用系統、數據庫、中間件、負載均衡、安全產品、和電力環境實時監控軟硬件設備運行狀態,打通監控死角,及時發現安全隱患,上報案例。
主干拓撲
分支子拓撲
3)實現對機房電源環境的綜合監控管理:通過建設機房電源環境檢測系統,對電源環境(如體溫、濕度、煙霧、漏水、UPS、門禁、視頻等)進行集中監控;與監控系統集成,實現功能顯示和報警統一管理。通過一體化監控服務器運維,故障響應和處理更加及時,大大提高了機房管理的效率和質量。
主頁集成
空調監控集成
電源監控集成
訪問控制集成
4)服務器全面監控:通過帶外服務器硬件監控模塊,實時掌握機房IBM、浪潮等服務器硬件運行狀態,如吊扇空轉、機箱和CPU溫度、電源電流、電源開關狀態、CMOS電池容量、CPU、磁盤、內存、RAID卡等運行狀態,結合操作系統監控,真正實現全方位主機監控管理,有效保證業務正常運行。
硬件檢測主要性能
5)服務器虛擬化綜合監控:勤智的虛擬化監控模塊通過深度API集成與廠商合作,實現對服務器虛擬化的綜合監控。以拓撲圖的形式解讀虛擬主機、虛擬網絡、虛擬存儲等資源連接關系,逐層展示虛擬資源的當前狀態和告警信息。據悉,該系統還提供了豐富的TOPN、虛擬資源、性能、告警統計報表。一體化的虛擬化監控模式,方便運維人員全面了解當前虛擬化資源的性能和容量趨勢,準確判斷虛擬化系統的運行情況。
資源統計
6)建立實時準確的資產配置管理數據庫:在上海港項目一期建設中,可跟蹤信息中心IT資產的基本信息和使用狀態逐步通過智能資產管理工具。全生命周期的資產配置管理,幫助資產管理者一目了然地查看所有資源清單,準確記錄資產的使用狀態服務器運維,提高資產設備的復用率,及時淘汰報廢設備,更新所需設備,提高資產利用率。 ,增加對 IT 資產的投資。
7)豐富準確的運維報表統計:勤智報表統計工具,采用獨立報表設計器,基于已有的采集、處理和運維數據,提供一系列性能、故障、排名,資產和運維統計報表。通過報告,上海港信息中心部門領導可以隨時查看大量運維數據,為未來IT投資方向和運維改進決策提供參考數據。