智能運維
-
挑戰 · 價值
挑戰
1. 系統壓力大:
平均日交易量可達3000筆+;每分鐘系統性能指標數據達到GB級;運維數據只能保留月度數據甚至1~2周數據量。
2. 運維協作少:
運維條線僵硬,整合分析困難,出現運維死角;運維數據缺乏統一管理,造成根因甄別排錯困難;業務部門與運維部門協調困難,難以實現敏捷開發,部署,上線快速業務創新。
3. 數據利用低:
大量的網絡流量與事務處理、日志文件、報警與事件、性能指標數據沒有有效利用;被動式IT運維方式,很少做到主動式/預測式IT運維,實現整體運維監控趨勢把握。
價值
如右圖所示: -
架構
單指標趨勢分析:
通過統計學理論/數學算法對歷史數據進行分析;按照不同日期特性,如:工作日/休息日/特殊運維日,進行單KPI預測;
按照不同的時段特性,如:交易高峰時段/交易平峰時段,進行單KPI上下限預測;
根據預測結果,結合實際值,制定不同的告警規則。
-
多KPI關聯分析
多KPI關聯分析:
通過統計學理論,挖掘指標間的關聯關系;通過統計學理論/數學算法對具有關聯關系的KPI進行數據分析,找到各KPI之間的標準誤差;通過算法計算各關聯指標之間的標準誤差,當標準誤差超過算法范圍后進行預警。
多KPI關聯根因分析:
根據各KPI的影響度提出故障解決的推薦意見;當多個KPI之間的關系被打破,即發生異常時,通過對大量數據的挖掘和學習,在第一時間找到異常發生的原因。 -
應用場景
數據中心成為當代各個行業發展的核心業務支撐。隨著科技的進步, 傳統數據中心正逐步向智能、高效、綠色新一代數據中心與“云”中心發展, 其IT 基礎設備部署呈現“ 大規模、高密度、復雜化”等特點,金融行業數據中心運維管理面臨新的挑戰。
我們提供了DCLive特權訪問管理方案:
對機房的服務器主機、網絡設備、軟件系統的網內或帶外維護訪問必須先經過DCLive 的認證
用戶不需要保管被訪問設備的特權帳號,通過密碼代填功能,直接打開會話窗口,提升了訪問效率,降低了安全風險
支持命令行的操作, 例如telnet 、SSH 、Console 等。支持圖形化的操作, 例如RDP、VNC、KVM 、IPMI等。支持第三方應用,例如電力調度專用的客戶端,數據庫客戶端等程序
提供完善的風險控制機制,用戶對IT設備的各類訪問操作,都會被記錄下來,用于后期審計