基本功能
數據中心基礎設施運維管理系統(DCIM)是近年來在數據中心運營管理的一個熱點。是為監控、管理及控制數據中心基礎設施的工作狀態和能耗水平,包括服務器、存儲、交換機等IT設備,以及空調、PDU等基礎設施。收集數據中心資產的運行狀態,并分析、整合提煉成有用的數據,從而幫助數據中心管理者,更好地管理數據中心,并優化性能。
通過科學的運維流程,保障數據中心的健康狀態。
其核心功能模塊包括監控管理、資產管理、倉庫管理、容量管理、上線下線、巡檢管理、運檢管理、預防性計劃、值班管理、能效管理、可視化管理等。
系統具有任務主動推送功能,在恰當的流程節點或時間節點,相關運維人員會收到冒泡、亮燈通知。
其用戶界面采用HTML5,用戶終端為各種手機、平板、桌面終端等,為運維管理帶來極大便利。
監控管理
數據中心監控管理需要實時采集、處理、存儲各種數據,其接入對象包括:配電、UPS、蓄電池、機房環境(空調、水浸、溫濕度)、門禁、安防、消防、IT設備等,是確保數據中心正常運行的重要環節。
關于監控管理進一步細節,請參考“物聯網平臺”。
資產管理
對數據中心基礎設施和IT設備從入庫到報廢的整個生命周期的管理。提供基礎數據,用于容量分析、維保、維修、巡檢等各個環節。為優化數據中心服務、保障數據中心運行提供基礎。
容量管理
一臺服務器上線,就占用了一定的U位、負載、冷量、載重、PDU、配線等資源,對于數據中心而言這些資源是有限的,超額使用會帶來風險。對這些資源的統一管理稱為容量管理,包括當前容量的顯示,容量趨勢等。容量管理也方便IT查詢,通過圖形化的機房-機柜-資產-網口點選操作,即可查閱該對象的容量占用及相關信息
上線下線
上線是為服務器分配機柜并投入運行的整個流程,其中有一個環節叫資源分配,即為服務器分配機柜、U位、網線、網址等,資源分配經由容量管理的校核。下線是將服務器停運并移出機柜的整個流程,其中有一個環節叫資源回收,其占用的資源釋放供再利用。
配線管理
配線是指服務器經由配線架到達交換機的整個通路。上線過程中打開設備面板即可點選其空閑端口,完成配線規劃。在容量管理界面點選網絡端口,即顯示該端口的整個配線。
巡檢管理
對日常巡視工作的管理,包括設置檢查項目、設置巡視路線、巡檢統計、故障處理等。巡檢支持GPS定位、二維碼識別等,可以通過平板、手機在線或離線執行。
運檢管理
運維管理包括缺陷管理、維保管理、作業規范、工作量統計等,其中的缺陷管理是當監控或巡檢發現故障后,進行的整個消缺流程,包括告警分析、應急處置、檢修申請、檢修過程管理(工作票或工單)等。作業規范包括操作規范、檢修規范、應急處置等。
倉庫管理
包括庫存管理、入庫流程、出庫流程。
預防性計劃
對一年內的運維計劃(比如診斷、測試、除灰等)進行管理,包括工作項目、時間安排等。到達計劃的時間節點,即主動通知相關運維人員執行該年度計劃,并跟蹤管理整個執行過程。
值班管理
包括班次、班組、成員、交接物品的設置,排班,值班交接等。厘清工作人員的職責,使盡力盡職工作。
能效管理
包括兩個方面:1、計算并顯示數據中心的PUE值,使對整體能耗狀況有所了解;2、對水冷機組、空調、出風口等進行集約化控制,使工作在最優模式下。
可視化管理
通過3D方式顯示數據中心實體,顯示其設備告警、實測數據、溫度場、資產、容量等信息;提供自動巡視功能,使具有身臨其境的感覺。同時,幫助管理人員從3D視角直觀地對溫度、容量進行評估和規劃。