• 全部
  • 經驗案例
  • 典型配置
  • 技術公告
  • FAQ
  • 漏洞說明
  • 全部
  • 全部
  • 大數據引擎
  • 知了引擎
產品線
搜索
取消
案例類型
發布者
是否解決
是否官方
時間
搜索引擎
匹配模式
高級搜索

3par存儲問題,

  • 0關注
  • 0收藏,594瀏覽
粉絲:0人 關注:3人

問題描述:

即使存在內部驅動器錯誤,節點1也不會被係統關閉,因為剩餘節點無法為某些LD提供服務。

進程 srsampler 無法在節點 1 上重複嚐試後啟動

 

The process identified in the message has exited and has been restarted automatically by the system. System operations should not be affected. Contact your authorized support provider for technical support and services.

 

2 個回答
粉絲:152人 關注:1人



🔍 報錯信息解讀

中文部分:

即使存在內部驅動器錯誤,節點 1 也不會被係統關閉,因為剩餘節點無法為某些 LD(Logical Disk)提供服務。

👉 含義:

  • 控製節點 1 檢測到內部磁盤或服務異常;

  • 但是係統評估發現,如果讓節點 1 下線(failover),部分 邏輯盤(LD) 將失去訪問路徑;

  • 因此係統 選擇保留節點 1 在線運行(degraded mode),以保持數據可用。

也就是說,目前是“節點部分異常但係統勉強維持運行”的狀態。


英文部分:

The process identified in the message has exited and has been restarted automatically by the system. System operations should not be affected.

👉 含義:

  • 報錯的進程(這裏是 srsampler)崩潰退出;

  • 係統已自動重啟該進程;

  • 暫時不會影響正常業務;

  • 如果持續出現,需要聯係 HPE 支持進一步分析。


⚙️ 進程說明:srsampler

  • 該進程屬於 3PAR 內部的 System Reporter(性能采樣/統計進程)

  • 主要負責收集 I/O 性能指標、延遲、容量利用率等;

  • 不是關鍵I/O路徑進程(不像 pd, ld, svd 那樣),所以不會直接影響存儲訪問;

  • 但頻繁重啟說明 節點 OS 或服務框架存在資源異常(例如內存耗盡、內部磁盤 I/O 慢、文件係統錯誤等)。


🚨 綜合判斷

當前係統出現了兩個層次的現象:

層次 報錯內容 含義
節點級別 節點 1 檢測到內部驅動器錯誤(node disk / OS disk / internal SSD) 節點內部硬件或文件係統可能異常
進程級別 srsampler 進程崩潰重啟 性能采樣進程異常,但業務仍可運行

這種組合說明:

節點1內部係統盤或內部服務子係統存在輕微錯誤,但目前係統還在運行,隻是處於潛在風險狀態。


🧭 建議處理步驟

  1. 查看節點狀態

    shownode -s shownode -state
    • 確認 node1 狀態是否為 OK

    • 若顯示 degradedpartial,說明確有問題。

  2. 檢查係統日誌

    showeventlog -min 1h

    showalert -d
    • 查找 node1 上是否有 “disk I/O error”、“filesystem error”、“controller panic”等關鍵詞。

  3. 查看內部磁盤狀態

    showpd -i

    查找類型為 “Cage 0” 或 “Node Disk” 的物理盤,狀態是否為 faileddegraded

  4. 若節點內盤有問題

    • 不要手動重啟節點;

    • 收集完整日誌後聯係 HPE 支持,他們通常會:

      • 檢查 core dump;

      • 可能安排替換 node 或內部磁盤;

      • 若確認僅為進程異常,會發補丁或指導重啟服務。

  5. 臨時措施

    • 如果係統運行正常,可繼續保持業務;

    • 定期監控 shownode 狀態;

    • 若節點 1 狀態惡化(如 “node lost”),請勿強製重啟,要先聯係支持。


✅ 總結建議

項目 狀態 建議
係統運行 正常但有潛在風險 持續監控
節點 1 內部錯誤未下線 不建議自行重啟
srsampler 進程 自動恢複 可忽略單次異常,若重複出現則上報
後續操作 收集日誌、聯係 HPE 支持 確保不丟數據

如果你方便的話,可以貼一下下麵幾條命令的輸出(打碼敏感信息即可),我能幫你進一步判斷是否隻是軟件層麵問題還是硬件風險:

shownode -s shownode -state showpd -i showalert -d


暫無評論

軍刺 五段
粉絲:3人 關注:0人

從您提供的 3PAR 存儲故障信息來看,可從以下幾個方麵分析和處理:

一、進程異常的影響分析

根據提示,srsamplerldrgsampler進程雖然退出,但係統已自動重啟這些進程,且明確說明 “System operations should not be affected”,因此當前業務運行暫時不會受到影響。這類進程通常與存儲係統的狀態采樣、負載檢測等功能相關,自動重啟機製是 3PAR 保障服務連續性的設計之一。

二、節點不關閉的原因

“即使存在內部驅動器錯誤,節點 1 也不會被係統關閉” 是 3PAR 的高可用性機製:當剩餘節點無法為某些邏輯磁盤(LD)提供服務時,係統會優先維持節點運行以保證數據可訪問,避免因節點關閉導致數據服務中斷。這是存儲係統在硬件故障時的 “業務優先” 策略,確保關鍵 LD 的可用性。

三、建議操作

  1. 短期觀察:監控存儲係統的性能、磁盤狀態和進程穩定性,確認是否有重複的進程退出日誌或新的硬件告警。
  2. 長期處理:按照提示 “Contact your authorized support provider”,聯係 HPE 授權技術支持。他們會通過深度日誌分析(如insplore數據)、內存檢測等手段,排查進程異常的根本原因(如資源競爭、潛在硬件問題等),並提供針對性的修複方案(如固件升級、配置調整等)。
綜上,當前故障屬於係統可自愈的輕微異常,無需緊急操作,但建議通過官方支持進一步排查潛在風險,以保障存儲係統的長期穩定運行。

暫無評論

編輯答案

你正在編輯答案

如果你要對問題或其他回答進行點評或詢問,請使用評論功能。

分享擴散:

提出建議

    +

親~登錄後才可以操作哦!

確定

親~檢測到您登陸的賬號未在http://hclhub.h3c.com進行注冊

注冊後可訪問此模塊

跳轉hclhub

你的郵箱還未認證,請認證郵箱或綁定手機後進行當前操作

舉報

×

侵犯我的權益 >
對根叔社區有害的內容 >
辱罵、歧視、挑釁等(不友善)

侵犯我的權益

×

泄露了我的隱私 >
侵犯了我企業的權益 >
抄襲了我的內容 >
誹謗我 >
辱罵、歧視、挑釁等(不友善)
騷擾我

泄露了我的隱私

×

您好,當您發現根叔知了上有泄漏您隱私的內容時,您可以向根叔知了進行舉報。 請您把以下內容通過郵件發送到pub.zhiliao@h3c.com 郵箱,我們會盡快處理。
  • 1. 您認為哪些內容泄露了您的隱私?(請在郵件中列出您舉報的內容、鏈接地址,並給出簡短的說明)
  • 2. 您是誰?(身份證明材料,可以是身份證或護照等證件)

侵犯了我企業的權益

×

您好,當您發現根叔知了上有關於您企業的造謠與誹謗、商業侵權等內容時,您可以向根叔知了進行舉報。 請您把以下內容通過郵件發送到 pub.zhiliao@h3c.com 郵箱,我們會在審核後盡快給您答複。
  • 1. 您舉報的內容是什麼?(請在郵件中列出您舉報的內容和鏈接地址)
  • 2. 您是誰?(身份證明材料,可以是身份證或護照等證件)
  • 3. 是哪家企業?(營業執照,單位登記證明等證件)
  • 4. 您與該企業的關係是?(您是企業法人或被授權人,需提供企業委托授權書)
我們認為知名企業應該坦然接受公眾討論,對於答案中不準確的部分,我們歡迎您以正式或非正式身份在根叔知了上進行澄清。

抄襲了我的內容

×

原文鏈接或出處

誹謗我

×

您好,當您發現根叔知了上有誹謗您的內容時,您可以向根叔知了進行舉報。 請您把以下內容通過郵件發送到pub.zhiliao@h3c.com 郵箱,我們會盡快處理。
  • 1. 您舉報的內容以及侵犯了您什麼權益?(請在郵件中列出您舉報的內容、鏈接地址,並給出簡短的說明)
  • 2. 您是誰?(身份證明材料,可以是身份證或護照等證件)
我們認為知名企業應該坦然接受公眾討論,對於答案中不準確的部分,我們歡迎您以正式或非正式身份在根叔知了上進行澄清。

對根叔社區有害的內容

×

垃圾廣告信息
色情、暴力、血腥等違反法律法規的內容
政治敏感
不規範轉載 >
辱罵、歧視、挑釁等(不友善)
騷擾我
誘導投票

不規範轉載

×

舉報說明