AIX如何监控电源状态?

查看电源设备基本信息

lscfg 命令

列出所有已安装的电源单元(PSU)的硬件信息:

lscfg -v | grep -p POWER

输出示例

  POWER SUPPLY:PS0   (1000W AC Power Supply)  
    Part Number: 00YXXXX  
    Serial Number: YL12345  
  POWER SUPPLY:PS1   (1000W AC Power Supply)  
    ...  

关键字段说明

  • PS0/PS1:电源单元编号(通常服务器有2个冗余电源)。
  • Part Number:电源部件号,用于识别型号。
  • Serial Number:电源序列号,用于保修或更换。

lsdev 命令

检查电源设备的状态(正常/异常):

lsdev -Cc psu

输出示例

ps0 Available 00-00 Power Supply  
ps1 Available 00-01 Power Supply  

状态解读

  • Available:电源工作正常。
  • Defined:电源未激活或未检测到(可能故障)。
  • Missing:物理电源未安装或连接异常。

诊断电源健康状态

diag 工具

运行硬件诊断工具获取详细电源报告:

diag → 选择"Task Selection" → "Diagnostic Routines" → "Power Subsystem"  

操作流程

  1. 选择对应电源单元(如ps0)。
  2. 执行诊断测试(如”LED Control”或”Functional Test”)。
  3. 查看结果:
    • 绿色/正常:输出Test completed successfully
    • 异常:显示错误码(如E0PS123),需记录并排查。

实时监控电源事件

errpt 命令

检查系统错误日志中的电源故障记录:

errpt -a | grep -i "power"

常见错误类型

  • POWER_SUPPLY_FAILURE:电源硬件故障。
  • PS_REDUNDANCY_LOST:冗余电源失效(仅剩单电源运行)。
  • VOLTAGE_FAULT:输入电压异常。

处理建议

  • 立即更换故障电源(参考lscfg输出的序列号定位物理位置)。
  • 联系IBM支持提供错误码(如LABEL: PWR_PS01_ERR)。

注意事项

  1. 权限要求:所有命令需root用户或等效权限(建议sudo)。
  2. 冗余电源告警:若lsdev显示单电源Available而另一状态为Defined,可能触发系统告警(需检查冗余性)。
  3. 物理操作:更换电源前务必关机断电,避免热插拔风险(除非设备明确支持)。
  4. 定期维护:建议每月执行diag测试,并通过cron定时运行errpt监控日志。

专业提示
对于关键业务系统,配置IBM System Director或HMC(Hardware Management Console)可实现电源状态自动化监控,减少人工检查成本,若遇复杂故障,优先参考IBM官方文档或拨打支持热线(提供错误码和序列号加速处理)。


引用说明
本文操作基于IBM AIX 7.2官方文档(Power Systems Hardware Information Center),命令兼容AIX 6.1及以上版本。

原创文章,发布者:酷番叔,转转请注明出处:https://cloud.kd.cn/ask/4530.html

(0)
酷番叔酷番叔
上一篇 2025年6月15日 03:00
下一篇 2025年6月15日 03:39

相关推荐

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

联系我们

400-880-8834

在线咨询: QQ交谈

邮件:HI@E.KD.CN

关注微信