03-硬件資源管理配置
本章節下載: 03-硬件資源管理配置 (260.83 KB)
目 錄
通過硬件資源管理功能,用戶能夠查看CPU、內存的使用情況,電源和風扇的工作狀態,配置設備運行的相關參數,實現對設備硬件資源的日常維護和管理。
設備管理的所有配置任務均為可選配置,配置時無先後順序要求,請根據實際需要選擇配置。設備管理配置任務如下:
· 監控CPU
¡ CPU顯示和維護
· 監控內存
¡ 配置內存告警門限
¡ 內存顯示和維護
· 顯示設備硬件信息
係統每隔1分鍾會對CPU的利用率進行采樣,並將采樣值和用戶配置的CPU利用率告警門限比較。
· 當采樣值大於低級別告警門限時,則CPU進入低級別告警狀態,會周期發送CPU低級別告警通知,直到CPU進入高級別告警狀態或者低級別告警狀態解除。
· 當采樣值大於高級別告警門限時,則CPU進入高級別告警狀態,會周期發送CPU高級別告警通知,直到高級別告警狀態解除。
· 當采樣值回落,小於CPU利用率恢複門限時,則認為CPU利用率已經恢複到正常範圍,並發送恢複告警通知。
CPU告警通知會同時向NETCONF、SNMP、信息中心三個方向輸出,通過配置NETCONF、SNMP、信息中心功能,CPU告警最終能以NETCONF事件、SNMP Trap或Inform消息、日誌的形式發送給用戶。NETCONF和SNMP的詳細介紹請參見“網絡管理和監控配置指導”中的“NETCONF”和“SNMP”。信息中心的詳細介紹請參見“設備管理配置指導”中的“信息中心”。
圖1-1 CPU告警示意圖
(1) 進入係統視圖。
system-view
(2) 配置CPU利用率閾值。
monitor cpu-usage threshold severe-threshold [ minor-threshold minor-threshold ] [ slot slot-number [ cpu cpu-number ] ]
缺省情況下,CPU利用率閾值為99%。
CPU利用率高級別告警門限如果設置過低,可能導致設備提前進入門限狀態,不再進行正常業務處理。
(3) 配置發送CPU告警事件的間隔。
monitor resend cpu-usage { minor-interval minor-interval | severe-interval severe-interval } * [ slot slot-number [ cpu cpu-number ] ]
缺省情況下,持續300秒超過低級別告警門限則上報一次CPU低級別告警事件,持續60秒超過高級別告警門限則上報一次CPU高級別告警事件。
開啟CPU利用率曆史記錄功能後,係統會每隔一定時間對CPU的利用率進行采樣,並把采樣結果保存到曆史記錄區。這些記錄可通過display cpu-usage history命令查看,以便用戶監控設備近期的運行情況。
(1) 進入係統視圖。
system-view
(2) 配置CPU利用率曆史記錄的采樣周期。
monitor cpu-usage interval interval [ slot slot-number [ cpu cpu-number ] ]
缺省情況下,CPU使用率曆史記錄采樣周期為1分鍾。
(3) 開啟CPU利用率曆史記錄功能。
monitor cpu-usage enable [ slot slot-number [ cpu cpu-number ] ]
缺省情況下,CPU使用率曆史記錄功能處於開啟狀態。
可在任意視圖下執行以下命令:
· 顯示CPU監控功能的相關配置。
display cpu-usage configuration [ slot slot-number [ cpu cpu-number ] ]
· 顯示CPU利用率的統計信息。
display cpu-usage [ data-plane ] [ summary ] [ slot slot-number [ cpu cpu-number ] ]
係統實時監控剩餘空閑內存大小,當條件達到一級、二級、三級告警門限或者恢複正常狀態門限時,就產生相應的告警/告警解除通知,通知關聯的業務模塊/進程采取相應的措施,以便最大限度的利用內存,又能保證設備的正常運行。
一級(minor)、二級(severe)和三級(critical)門限,對應的剩餘空閑內存越來越少,緊急程度越來越嚴重。
· 當剩餘空閑內存值從大於變成小於等於一級告警門限時,產生一級告警。
· 當剩餘空閑內存值從大於變成小於等於二級告警門限時,產生二級告警。
· 當剩餘空閑內存值從大於變成小於等於三級告警門限時,產生三級告警。
· 當剩餘空閑內存值從小於等於變成大於二級告警門限時,產生三級告警解除通知。
· 當剩餘空閑內存值從小於等於變成大於一級告警門限時,產生二級告警解除通知。
· 當剩餘空閑內存值從小於等於變成大於正常內存大小時,產生一級告警解除通知。
同一級別的告警/告警解除通知是交替進行的:當剩餘空閑內存值小於等於某級告警門限,設備產生相應級別的告警,後續隻有該告警解除了,剩餘空閑內存值再次小於等於某級告警門限時,才會再次生成該級別的告警。
當剩餘空閑內存大小如圖1-2中曲線所示時,會生成如圖1-2所示的告警和解除告警通知。
當設備出現內存告警時,可刪除暫時不用的配置或關閉部分功能來釋放內存。但因為內存不足,部分配置可能刪除失敗。
(1) 進入係統視圖。
system-view
(2) 配置內存利用率閾值。
memory-threshold [ slot slot-number [ cpu cpu-number ] ] usage memory-threshold
缺省情況下,內存利用率閾值為100%。
(3) 配置空閑內存告警的門限值。
memory-threshold [ slot slot-number [ cpu cpu-number ] ] [ ratio ] minor minor-value severe severe-value critical critical-value normal normal-value
本命令的缺省情況與設備的型號有關,請以設備的實際情況為準。
型號 |
說明 |
MSR1008 |
一級告警門限為96MB,二級告警門限為64MB,三級告警門限為48MB,係統恢複到正常的內存門限為128MB |
MSR2630E-X1 |
一級告警門限為96MB,二級告警門限為64MB,三級告警門限為48MB,係統恢複到正常的內存門限為128MB |
MSR3610E-X1、MSR3610E-X1-DP |
一級告警門限為96MB,二級告警門限為64MB,三級告警門限為48MB,係統恢複到正常的內存門限為128MB |
型號 |
說明 |
MSR2660-XS |
一級告警門限為96MB,二級告警門限為64MB,三級告警門限為48MB,係統恢複到正常的內存門限為128MB |
MSR2680-XS |
一級告警門限為96MB,二級告警門限為64MB,三級告警門限為48MB,係統恢複到正常的內存門限為128MB |
型號 |
說明 |
MSR2600-12X-WiNet |
一級告警門限為96MB,二級告警門限為64MB,三級告警門限為48MB,係統恢複到正常的內存門限為128MB |
MSR2610-13X-WiNet |
一級告警門限為96MB,二級告警門限為64MB,三級告警門限為48MB,係統恢複到正常的內存門限為128MB |
可在任意視圖下執行以下命令:
· 顯示設備的內存使用狀態。
display memory [ summary ] [ slot slot-number [ cpu cpu-number ] ]
· 顯示內存告警門限相關信息。
display memory-threshold [ slot slot-number [ cpu cpu-number ] ]
某些協議模塊(比如STP、DLDP等)在特定情況下會自動關閉某個端口。在協議自動關閉端口的同時,係統會啟動一個檢測端口狀態的定時器。當定時器超時,如果該端口仍處於關閉狀態,則係統自動將端口恢複到真實的物理狀態。本功能用於配置係統檢測端口狀態定時器的時長。
(1) 進入係統視圖。
system-view
(2) 配置端口狀態檢測定時器的時長。
shutdown-interval time
缺省情況下,端口狀態檢測定時器時長為30秒。
可以通過顯示可插拔接口模塊的主要特征參數或者電子標簽信息來識別可插拔接口模塊。
· 可插拔接口模塊的主要特征參數包括:模塊型號、連接器類型、發送激光的中心波長、信號的有效傳輸距離、模塊生產廠商名稱等信息。
· 電子標簽信息也可以稱為永久配置數據或檔案信息,在光模塊或者設備的調試、測試過程中被寫入到光模塊或者設備的存儲器件中,包括光模塊或者設備的名稱、生產序列號、MAC地址、製造商等信息。
另外,當設備上插入的光模塊的生產廠商不是H3C時,設備會打印Log信息提醒用戶,要求用戶更換成H3C的光模塊,以便管理和維護光模塊。關於Log輸出規則的配置請參見“設備管理配置指導”中的“信息中心”。
請在任意視圖下執行以下命令。
· 顯示可插拔接口模塊的主要特征參數。
display transceiver interface [ interface-type interface-number ]
· 顯示可插拔接口模塊的電子標簽信息。
display transceiver manuinfo interface [ interface-type interface-number ]
係統提供故障告警信息描述了可插拔接口模塊的故障來源,以便用戶診斷和解決故障。係統還提供了數字診斷功能,其原理是對影響光模塊工作的關鍵參數進行監控(這些關鍵參數包括:溫度、電壓、激光偏置電流、發送光功率和接收光功率等),當這些參數的值異常時,用戶可以采取相應的措施,預防故障發生。
請在任意視圖下執行以下命令。
· 顯示可插拔接口模塊的當前故障告警信息。
display transceiver alarm interface [ interface-type interface-number ]
· 顯示可插拔光模塊的數字診斷參數的當前測量值。
display transceiver diagnosis interface [ interface-type interface-number ]
可在任意視圖下執行以下命令,顯示設備的硬件信息。
display device [ flash | usb ] [ slot slot-number [ subslot subslot-number ] | verbose ]
可在任意視圖下執行以下命令,顯示設備的電子標簽信息。
display device manuinfo [ slot slot-number [ subslot subslot-number ] ]
可在任意視圖下執行以下命令,顯示設備硬件的告警信息。
display alarm [ slot slot-number ]
不同款型規格的資料略有差異, 詳細信息請向具體銷售和400谘詢。H3C保留在沒有任何通知或提示的情況下對資料內容進行修改的權利!