想按名称或类型查找?试试这个技巧!

基础通配符过滤

通过 Shell 通配符快速匹配文件名:

ls *.txt          # 列出所有.txt文件
ls report?.log    # 匹配 report1.log, report2.log 等
ls image[0-9].jpg # 匹配 image0.jpg 到 image9.jpg
rm -v !(*.bak)    # 删除非备份文件(需启用 extglob: shopt -s extglob)

find 命令:递归深度过滤

最强大的文件搜索工具,支持多条件组合:

find ~ -type f -size +10M               # 查找主目录大于10MB的文件
# 时间过滤(mtime=修改时间)
find /etc -mtime -7 -name "*.conf"      # 查找7天内修改的.conf文件
# 权限过滤
find . -perm 644 -exec ls -l {} \;      # 查找权限644的文件并列出详情
# 组合删除(谨慎使用)
find /tmp -type f -mtime +30 -delete    # 删除/tmp中30天前的文件

grep 家族:内容过滤

grep – 基础文本搜索

grep "error" /var/log/syslog          # 搜索包含"error"的行
grep -i "warning" app.log             # 忽略大小写搜索
grep -r "TODO" ~/projects/            # 递归搜索目录
grep -v "success" transaction.log     # 过滤掉含"success"的行

egrep – 扩展正则表达式

egrep "error|fail" system.log         # 匹配"error"或"fail"
egrep "^[A-Z]" document.txt           # 匹配以大写字母开头的行

zgrep – 压缩文件搜索

zgrep "404" /var/log/nginx/access.log.*.gz  # 在gzip日志中搜索

awk:结构化数据过滤

处理列式数据(如 CSV、日志):

awk -F':' '{print $1}' /etc/passwd          # 提取用户名(以:分隔)
awk '$3 > 1000' /etc/passwd                 # 打印UID大于1000的用户
awk '/GET/ {count++} END {print count}' access.log  # 统计GET请求次数

sed:流编辑器过滤

文本替换与提取:

sed -n '/2025-10-01/p' server.log     # 打印含日期的行
sed 's/old/new/g' file.txt            # 全局替换文本
sed -e '1d' -e '$d' data.csv          # 删除首尾行

正则表达式高级技巧

通用匹配规则(适用于 grep/sed/awk):

  • ^ : 行首锚点
    grep "^start" file
  • : 行尾锚点
    grep "end$" file
  • \d : 数字(需启用 -P 选项)
    grep -P "\d{3}-\d{4}" contacts.txt
  • : 任意字符
    grep "user:.*active" log

组合命令实战案例

案例 1:分析 Nginx 日志

# 统计每小时请求量
awk '{print $4}' access.log | cut -d: -f2 | sort | uniq -c
# 提取 500 错误请求的客户端 IP
grep " 500 " access.log | awk '{print $1}' | sort -n | uniq -c

案例 2:批量重命名图片

find . -name "*.JPG" -exec rename 's/\.JPG$/.jpg/' {} \;

案例 3:清理临时文件

find /tmp -type f -user $(whoami) -mtime +7 -exec rm -f {} \;

注意事项

  1. 权限控制
    使用 sudo 访问受限目录:
    sudo grep "error" /var/log/auth.log
  2. 防误删风险
    执行 rm 前用 echo 预览:
    find . -name "*.tmp" -exec echo "Deleting: {}" \;
  3. 正则兼容性
    • 基础正则(BRE):grep 默认
    • 扩展正则(ERE):grep -Eegrep
    • Perl 正则(PCRE):grep -P
  4. 大文件处理
    lesstail -f 避免内存溢出

掌握 Linux 文件过滤技术可提升 10 倍运维效率,关键步骤:

  1. 文件名过滤 → find / 通配符过滤 → grep / awk
  2. 流处理 → sed / 管道组合

权威参考来源

  • GNU Coreutils 官方文档:https://www.gnu.org/software/coreutils/
  • Linux man 命令手册(终端输入 man grep / man find
  • POSIX 正则表达式标准:IEEE Std 1003.1-2017
  • 《Linux命令行与Shell脚本编程大全》(Richard Blum, Christine Bresnahan 著)

原创文章,发布者:酷番叔,转转请注明出处:https://cloud.kd.cn/ask/9319.html

(0)
酷番叔酷番叔
上一篇 19小时前
下一篇 19小时前

相关推荐

  • 工资不够花?三招教你多赚五千

    在Linux系统中,SELinux(安全增强型Linux)作为强制访问控制机制,能有效提升系统安全性,但有时合法应用会被SELinux策略阻止运行,此时需添加”白名单”(即自定义规则),以下是三种主流方法,操作前请确认问题确由SELinux引起(通过sudo ausearch -m avc -ts recent……

    4天前
    600
  • Windows下误删Linux分区怎么办?

    方法1:使用Windows磁盘管理工具(推荐基础用户)原理:删除Linux分区后重建为Windows兼容格式(NTFS/FAT32),步骤:打开磁盘管理按 Win + R 输入 diskmgmt.msc 回车,定位Linux分区 识别Linux分区(通常显示为”未分配”或”RAW”,无盘符),删除分区 右键点击……

    2025年7月9日
    1600
  • UUID能确保系统更稳定吗

    在Linux系统中,修改磁盘的标识名称(通常称为文件系统标签或卷标)是常见的操作,与Windows的“盘符”概念不同,Linux通过标签(Label)或UUID来识别存储设备,以下是详细的操作方法:核心概念说明设备名(如 /dev/sda1):由内核自动分配,通常不建议修改(重启后可能变化),文件系统标签(La……

    2025年6月16日
    2100
  • 为什么同事升职总比你快

    环境准备安装GCC编译器Linux默认不安装编译器,需手动安装GNU Compiler Collection (GCC):sudo apt update && sudo apt install gcc # Debian/Ubuntusudo dnf install gcc # Fedora/Ce……

    2025年6月18日
    2600
  • 如何快速找到Java可执行文件路径在哪

    在Windows系统中使用where java命令,在Linux/macOS系统中使用which java或command -v java命令,可快速定位Java可执行文件(如java.exe或java)的安装路径。

    2025年7月19日
    1300

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

联系我们

400-880-8834

在线咨询: QQ交谈

邮件:HI@E.KD.CN

关注微信