節點所有硬盤異常的修複步驟如下(請按順序操作):
檢查存儲狀態
登錄節點後台執行:
ceph -s # 確認存儲集群健康狀態
Health_OK
),但前台顯示異常 → 可能為前台服務異常,跳到步驟3。進入維護模式
在UIS管理界麵將節點進入維護模式(操作前需遷移虛擬機):
# 節點後台執行命令同步時間並重啟
sync && hwclock -w && shutdown -h now
📌 注意:
若節點有業務虛擬機無法停機 → 先遷移虛擬機至正常節點,再進入維護模式。
重啟進程
執行以下命令修複前台顯示:
supervisorctl restart onestor-peon # 重啟存儲管理進程
service apache2 restart # 重啟Web服務
檢查殘留掛載點
若此前換盤未卸載舊OSD:
mount | grep osd # 檢查異常OSD掛載點
umount /var/lib/ceph/osd/ceph-{異常OSD編號} # 手動卸載殘留掛載點
強製刪除殘留OSD
後台手動刪除故障OSD(需謹慎):
ceph osd crush remove osd.{ID} # 移除CRUSH映射
ceph auth del osd.{ID} # 刪除認證密鑰
ceph osd rm osd.{ID} # 刪除OSD
ceph-disk zap /dev/{磁盤名} # 格式化磁盤
數據庫殘留清理
若前台仍顯示異常硬盤(PostgreSQL殘留數據):
sudo -u postgres psql calamari # 進入數據庫
SELECT * FROM op_cluster_disk WHERE host_name='節點名'; # 查詢異常硬盤
DELETE FROM op_cluster_disk WHERE sn='異常硬盤SN號'; # 刪除殘留記錄
ceph -s # 確保集群狀態為`Health_OK`
lsblk # 確認所有硬盤識別正常
ntpstat # 檢查時間同步狀態
ceph -s
輸出/var/log/ceph/
日誌📘 參考文檔:
(0)
暫無評論
親~登錄後才可以操作哦!
確定你的郵箱還未認證,請認證郵箱或綁定手機後進行當前操作
舉報
×
侵犯我的權益
×
侵犯了我企業的權益
×
抄襲了我的內容
×
原文鏈接或出處
誹謗我
×
對根叔社區有害的內容
×
不規範轉載
×
舉報說明
暫無評論