如何快速提取data.txt第2、4、5列?

方法1:使用 cut 命令(简单分隔符场景)

适用场景:列由固定分隔符(如逗号、制表符)分隔,且列位置连续。
命令格式

cut -d '分隔符' -f 列序号列表 文件名

示例

# 提取第1到第3列(分隔符为制表符,默认)
cut -f 1-3 data.txt

注意

  • -d 指定分隔符(默认制表符),-f 指定列号(支持1,3,52-5格式)。
  • 缺点:无法处理空格等不固定分隔符。

方法2:使用 awk 命令(灵活处理复杂格式)

适用场景:分隔符不固定、需条件过滤或非连续列。
命令格式

awk -F '分隔符' '{print $列1 $列2 ...}' 文件名

示例

# 提取第1列和第3列(分隔符为空格或制表符)
awk '{print $1, $3}' data.txt
# 提取第2列和第4列(分隔符为冒号)
awk -F ':' '{print $2, $4}' /etc/passwd
# 结合条件:仅当第3列大于10时输出第1列和第2列
awk '$3 > 10 {print $1, $2}' data.csv

优势

  • -F 支持正则表达式(如-F "[,:]"表示逗号或冒号)。
  • 列号用加数字表示($1为第一列),OFS变量可自定义输出分隔符(如awk 'BEGIN{OFS=";"} {...}')。

方法3:使用 paste + 循环(合并多个命令的输出)

适用场景:需从不同命令或非连续列组合数据。
示例

# 合并ls命令的第1列(文件名)和第5列(大小)
ls -l | awk '{print $1}' > col1.txt
ls -l | awk '{print $5}' > col5.txt
paste col1.txt col5.txt

简化写法

paste <(ls -l | awk '{print $1}') <(ls -l | awk '{print $5}')

方法4:使用 datamash 工具(结构化数据处理)

适用场景:需高级表格操作(需安装:sudo apt install datamash)。
示例

# 提取第1列和第3列(分隔符为空格)
datamash -t ' ' cut 1,3 data.txt

总结与建议

方法 最佳场景 优势
cut 简单分隔符、连续列 语法简洁,执行速度快
awk 复杂分隔符、条件过滤、非连续列 功能强大,灵活度高
paste 合并多命令输出 适合管道操作
datamash 结构化数据的高级操作 支持统计、排序等扩展功能

安全提示

  • 处理用户输入文件时,避免使用-i原地修改参数,建议先备份。
  • 对未知文件先用head预览结构(如head -n 5 file)。

引用说明
本文方法参考GNU Coreutils官方文档(cut、awk)及Linux man手册,实践前建议通过man cutman awk查看系统帮助。

原创文章,发布者:酷番叔,转转请注明出处:https://cloud.kd.cn/ask/8954.html

(0)
酷番叔酷番叔
上一篇 2025年7月28日 01:55
下一篇 2025年7月28日 02:11

相关推荐

  • linux系统程序如何复制

    Linux系统中,可使用cp命令复制程序,如`cp 源文件路径

    2025年8月14日
    12200
  • Linux如何清理inode?实用操作方法与步骤详解

    inode是Linux文件系统中用于存储文件元数据的重要数据结构,每个文件、目录、设备等对象都会分配一个唯一的inode,记录文件的权限、所有者、大小、时间戳及数据块位置等信息,当inode耗尽时,即使磁盘空间充足,系统也无法创建新文件,因此及时清理inode占用是Linux系统维护的重要工作,本文将详细介绍L……

    2025年9月21日
    10100
  • Linux环境下破解软件的常用方法、步骤及注意事项有哪些?

    在Linux环境下处理软件破解需明确法律风险:未经授权破解软件违反版权法,可能导致法律纠纷;破解过程可能引入恶意软件,危害系统安全,本文仅从技术角度客观分析Linux环境下常见的软件绕过验证方法,并强调合法使用软件的重要性,Linux系统因其开放性和丰富的工具链,常被用于分析软件机制,但破解行为需在法律允许范围……

    2025年10月3日
    7900
  • 如何硬盘格式化 linux

    Linux 中,可使用命令如 mkfs(如 `mkfs.

    2025年8月13日
    9500
  • 为什么Linux所有文件夹都从根目录开始?

    Linux文件夹的存储规则根目录()所有文件夹的起点,类似Windows的C:\,/home:存储用户个人文件夹(如/home/username)/etc:存放系统配置文件/var:存储日志、缓存等动态数据绝对路径 vs 相对路径绝对路径:从根目录开始的完整路径(如/usr/local/bin)相对路径:基于当……

    2025年6月19日
    14000

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

联系我们

400-880-8834

在线咨询: QQ交谈

邮件:HI@E.KD.CN

关注微信