想按名称或类型查找?试试这个技巧!

基础通配符过滤

通过 Shell 通配符快速匹配文件名:

ls *.txt          # 列出所有.txt文件
ls report?.log    # 匹配 report1.log, report2.log 等
ls image[0-9].jpg # 匹配 image0.jpg 到 image9.jpg
rm -v !(*.bak)    # 删除非备份文件(需启用 extglob: shopt -s extglob)

find 命令:递归深度过滤

最强大的文件搜索工具,支持多条件组合:

find ~ -type f -size +10M               # 查找主目录大于10MB的文件
# 时间过滤(mtime=修改时间)
find /etc -mtime -7 -name "*.conf"      # 查找7天内修改的.conf文件
# 权限过滤
find . -perm 644 -exec ls -l {} \;      # 查找权限644的文件并列出详情
# 组合删除(谨慎使用)
find /tmp -type f -mtime +30 -delete    # 删除/tmp中30天前的文件

grep 家族:内容过滤

grep – 基础文本搜索

grep "error" /var/log/syslog          # 搜索包含"error"的行
grep -i "warning" app.log             # 忽略大小写搜索
grep -r "TODO" ~/projects/            # 递归搜索目录
grep -v "success" transaction.log     # 过滤掉含"success"的行

egrep – 扩展正则表达式

egrep "error|fail" system.log         # 匹配"error"或"fail"
egrep "^[A-Z]" document.txt           # 匹配以大写字母开头的行

zgrep – 压缩文件搜索

zgrep "404" /var/log/nginx/access.log.*.gz  # 在gzip日志中搜索

awk:结构化数据过滤

处理列式数据(如 CSV、日志):

awk -F':' '{print $1}' /etc/passwd          # 提取用户名(以:分隔)
awk '$3 > 1000' /etc/passwd                 # 打印UID大于1000的用户
awk '/GET/ {count++} END {print count}' access.log  # 统计GET请求次数

sed:流编辑器过滤

文本替换与提取:

sed -n '/2025-10-01/p' server.log     # 打印含日期的行
sed 's/old/new/g' file.txt            # 全局替换文本
sed -e '1d' -e '$d' data.csv          # 删除首尾行

正则表达式高级技巧

通用匹配规则(适用于 grep/sed/awk):

  • ^ : 行首锚点
    grep "^start" file
  • : 行尾锚点
    grep "end$" file
  • \d : 数字(需启用 -P 选项)
    grep -P "\d{3}-\d{4}" contacts.txt
  • : 任意字符
    grep "user:.*active" log

组合命令实战案例

案例 1:分析 Nginx 日志

# 统计每小时请求量
awk '{print $4}' access.log | cut -d: -f2 | sort | uniq -c
# 提取 500 错误请求的客户端 IP
grep " 500 " access.log | awk '{print $1}' | sort -n | uniq -c

案例 2:批量重命名图片

find . -name "*.JPG" -exec rename 's/\.JPG$/.jpg/' {} \;

案例 3:清理临时文件

find /tmp -type f -user $(whoami) -mtime +7 -exec rm -f {} \;

注意事项

  1. 权限控制
    使用 sudo 访问受限目录:
    sudo grep "error" /var/log/auth.log
  2. 防误删风险
    执行 rm 前用 echo 预览:
    find . -name "*.tmp" -exec echo "Deleting: {}" \;
  3. 正则兼容性
    • 基础正则(BRE):grep 默认
    • 扩展正则(ERE):grep -Eegrep
    • Perl 正则(PCRE):grep -P
  4. 大文件处理
    lesstail -f 避免内存溢出

掌握 Linux 文件过滤技术可提升 10 倍运维效率,关键步骤:

  1. 文件名过滤 → find / 通配符过滤 → grep / awk
  2. 流处理 → sed / 管道组合

权威参考来源

  • GNU Coreutils 官方文档:https://www.gnu.org/software/coreutils/
  • Linux man 命令手册(终端输入 man grep / man find
  • POSIX 正则表达式标准:IEEE Std 1003.1-2017
  • 《Linux命令行与Shell脚本编程大全》(Richard Blum, Christine Bresnahan 著)

原创文章,发布者:酷番叔,转转请注明出处:https://cloud.kd.cn/ask/9319.html

(0)
酷番叔酷番叔
上一篇 2025年7月30日 18:57
下一篇 2025年7月30日 19:20

相关推荐

  • Linux系统引导文件损坏后如何修复?

    Linux系统引导文件是启动过程中的核心组件,若引导文件损坏(如GRUB配置丢失、MBR扇区被覆盖、UEFI引导分区异常等),系统可能无法正常启动,出现黑屏、GRUB rescue提示或直接进入BIOS/UEFI界面,修复引导文件需根据引导方式(MBR或UEFI)和损坏程度逐步操作,以下是详细修复流程,修复前准……

    2025年10月2日
    7000
  • 如何高效配置Linux服务器?

    配置Linux服务器需完成系统安装、安全加固(防火墙、SSH密钥认证、用户权限)、软件包更新、必要服务(如Web、数据库)安装与优化,以及设置监控和备份策略,确保稳定安全运行。

    2025年7月21日
    10300
  • Linux如何清理内存释放空间?实用方法有哪些?

    Linux内存管理机制与其他操作系统存在显著差异,其核心设计理念是“尽可能利用空闲内存”,因此即使系统看似“内存占用高”,也可能处于健康状态,理解这一点后,才能正确判断是否需要清理内存以及如何清理,Linux内存管理基础:为何“内存占用高”≠“内存不足”Linux将内存分为物理内存和交换空间(Swap)两部分……

    2025年10月5日
    6800
  • Linux中如何正确转义字符串?

    在Linux系统中,字符串转义是处理命令行操作、脚本编写和文本处理时的核心技能,由于Linux命令行环境中的许多字符(如空格、引号、美元符号等)具有特殊含义,若直接使用可能导致命令解析错误、变量替换异常或路径解析失败,通过转义字符将这些特殊字符的字面意义保留下来,是确保命令正确执行的关键,Linux字符串转义的……

    2025年9月16日
    7400
  • Mac装Linux,双系统还是虚拟机?

    准备工作硬件兼容性检查Intel 芯片 Mac:支持大多数 Linux 发行版(如 Ubuntu、Fedora),Apple Silicon(M1/M2/M3):需选择支持 ARM 架构的发行版(如 Ubuntu ARM、Asahi Linux),T2 安全芯片机型(2018年后部分 Intel Mac):需关……

    2025年7月5日
    10400

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

联系我们

400-880-8834

在线咨询: QQ交谈

邮件:HI@E.KD.CN

关注微信