程序员如何避免996加班?

在Linux系统中监控硬件温度对于维护系统稳定性、预防过热损坏及优化性能至关重要,以下详细介绍多种命令行与图形化工具的操作方法,涵盖CPU、硬盘、GPU等核心硬件:


核心工具安装与配置

lm-sensors(CPU/主板传感器)

  • 安装
    sudo apt install lm-sensors  # Debian/Ubuntu
    sudo dnf install lm-sensors  # Fedora/CentOS
  • 配置
    sudo sensors-detect  # 按提示选择YES,加载硬件驱动
    sudo service kmod start  # 启用内核模块
  • 查看温度
    sensors  # 显示所有传感器数据(含CPU温度)
    sensors | grep "Core"  # 过滤CPU核心温度

    输出示例:

    Core 0:        +45.0°C  (high = +95.0°C)
    Core 1:        +44.5°C  (high = +95.0°C)

hddtemp(机械硬盘/SSD)

  • 安装
    sudo apt install hddtemp  # Debian/Ubuntu
    sudo dnf install hddtemp  # Fedora/CentOS
  • 查看硬盘温度
    sudo hddtemp /dev/sda  # 替换sda为实际硬盘标识

    输出示例:

    /dev/sda: ST1000DM010: 38°C

NVMe固态硬盘专用工具

sudo apt install nvme-cli  # 安装工具
sudo nvme smart-log /dev/nvme0 | grep "Temperature"  # 查看温度

GPU温度监控

NVIDIA显卡

nvidia-smi --query-gpu=temperature.gpu --format=csv  # 需安装NVIDIA驱动

AMD显卡

sudo apt install radeontop  # 安装工具
radeontop -l 1 | grep "temp"  # 实时监控温度

通用工具(适用于集显/核显)

sudo apt install mesa-utils  # 安装工具
glxinfo -B | grep "Temperature"  # 部分驱动支持

图形化工具推荐

  1. Psensor(跨硬件支持):
    sudo apt install psensor  # 安装

    启动后自动检测传感器,可视化显示温度曲线。

  2. GKrellM(轻量级监控面板):
    sudo apt install gkrellm  # 安装

    桌面悬浮窗实时展示温度、风扇转速等数据。


进阶监控方案

定时日志记录(cron任务)

echo "*/5 * * * * root sensors >> /var/log/temp.log" | sudo tee /etc/cron.d/temp_monitor
  • 每5分钟记录一次温度到/var/log/temp.log

温度过高警报脚本

if [ $TEMP -gt 85 ]; then
  echo "警告!CPU温度过高:${TEMP}°C" | mail -s "系统过热警报" admin@example.com
fi

常见问题解决

  1. 无温度数据输出?
    • 运行 sudo sensors-detect 重新配置驱动
    • 检查内核模块加载:lsmod | grep coretemp
  2. 权限不足错误
    • 使用 sudo 执行命令
    • 将用户加入 videodisk 组:sudo usermod -aG video $USER
  3. 硬件兼容性
    • 老旧硬件可能需手动启用驱动(如 modprobe it87
    • 查阅主板手册确认传感器型号

定期监控硬件温度可有效延长设备寿命并避免意外关机,建议:

  • 日常使用:sensors + hddtemp 快速检查
  • 长期监控:配置 Psensor 或定时日志
  • 服务器环境:集成到Zabbix/Prometheus监控系统

引用说明: 基于Linux内核文档(kernel.org/doc)、lm-sensors官方手册(github.com/lm-sensors/lm-sensors)及Arch Linux硬件监控指南(wiki.archlinux.org/title/lm_sensors),工具使用方法经Ubuntu 22.04/Fedora 36实测验证。

原创文章,发布者:酷番叔,转转请注明出处:https://cloud.kd.cn/ask/9928.html

(0)
酷番叔酷番叔
上一篇 2小时前
下一篇 2小时前

相关推荐

  • 如何安全停止runsv服务?

    推荐方法:使用 sv 命令(安全且标准)sv是runit的配套控制工具,通过它可安全停止服务:停止单个服务sv down /path/to/service/directory说明:/path/to/service/directory 是服务的目录(如/etc/service/nginx),此命令会发送TERM信……

    2025年7月27日
    700
  • 如何安全高效克隆Linux系统盘?

    拷贝 Linux 系统盘是系统迁移、备份或升级硬盘的常见需求,以下提供三种经过验证的方法,兼顾安全性与效率,操作前请务必备份重要数据,避免意外丢失,准备工作备份数据:使用 tar 或 rsync 备份 /home、/etc 等关键目录,记录分区信息:sudo fdisk -l 或 lsblk 查看原盘分区结构……

    2025年6月27日
    2600
  • 如何快速查看Linux服务器配置?

    系统基本信息操作系统版本命令: cat /etc/os-release或lsb_release -a # 需先安装 `lsb-release` 包输出示例: NAME=”Ubuntu”VERSION=”22.04 LTS”作用:确认发行版名称、版本号及代号,内核版本与架构命令: uname -a输出关键字段:x……

    2025年6月27日
    1900
  • Linux无法读写U盘?,Linux U盘识别失败怎么办?,Linux挂载U盘权限错误?

    检测U盘是否被识别物理连接插入U盘后,观察指示灯(如有),系统通常发出提示音(需启用声音提示),终端检测打开终端(Ctrl+Alt+T),执行命令:lsblk # 列出所有块设备(含U盘)dmesg | tail # 查看内核日志末尾的U盘识别记录输出示例: sdb 8:16 1 14.9G 0 disk└─s……

    2025年7月29日
    700
  • Linux如何查看当前连接用户?

    who 命令:查看当前登录用户命令:who输出示例:user1 pts/0 2023-10-05 14:30 (192.168.1.10)user2 tty1 2023-10-05 09:15 (:0)参数解析:用户名:登录用户的账户名,终端类型:pts/*:远程终端(如SSH连接),tty*:本地物理终端,登……

    2025年7月23日
    1400

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

联系我们

400-880-8834

在线咨询: QQ交谈

邮件:HI@E.KD.CN

关注微信