如何快速提取data.txt第2、4、5列?

方法1:使用 cut 命令(简单分隔符场景)

适用场景:列由固定分隔符(如逗号、制表符)分隔,且列位置连续。
命令格式

cut -d '分隔符' -f 列序号列表 文件名

示例

# 提取第1到第3列(分隔符为制表符,默认)
cut -f 1-3 data.txt

注意

  • -d 指定分隔符(默认制表符),-f 指定列号(支持1,3,52-5格式)。
  • 缺点:无法处理空格等不固定分隔符。

方法2:使用 awk 命令(灵活处理复杂格式)

适用场景:分隔符不固定、需条件过滤或非连续列。
命令格式

awk -F '分隔符' '{print $列1 $列2 ...}' 文件名

示例

# 提取第1列和第3列(分隔符为空格或制表符)
awk '{print $1, $3}' data.txt
# 提取第2列和第4列(分隔符为冒号)
awk -F ':' '{print $2, $4}' /etc/passwd
# 结合条件:仅当第3列大于10时输出第1列和第2列
awk '$3 > 10 {print $1, $2}' data.csv

优势

  • -F 支持正则表达式(如-F "[,:]"表示逗号或冒号)。
  • 列号用加数字表示($1为第一列),OFS变量可自定义输出分隔符(如awk 'BEGIN{OFS=";"} {...}')。

方法3:使用 paste + 循环(合并多个命令的输出)

适用场景:需从不同命令或非连续列组合数据。
示例

# 合并ls命令的第1列(文件名)和第5列(大小)
ls -l | awk '{print $1}' > col1.txt
ls -l | awk '{print $5}' > col5.txt
paste col1.txt col5.txt

简化写法

paste <(ls -l | awk '{print $1}') <(ls -l | awk '{print $5}')

方法4:使用 datamash 工具(结构化数据处理)

适用场景:需高级表格操作(需安装:sudo apt install datamash)。
示例

# 提取第1列和第3列(分隔符为空格)
datamash -t ' ' cut 1,3 data.txt

总结与建议

方法 最佳场景 优势
cut 简单分隔符、连续列 语法简洁,执行速度快
awk 复杂分隔符、条件过滤、非连续列 功能强大,灵活度高
paste 合并多命令输出 适合管道操作
datamash 结构化数据的高级操作 支持统计、排序等扩展功能

安全提示

  • 处理用户输入文件时,避免使用-i原地修改参数,建议先备份。
  • 对未知文件先用head预览结构(如head -n 5 file)。

引用说明
本文方法参考GNU Coreutils官方文档(cut、awk)及Linux man手册,实践前建议通过man cutman awk查看系统帮助。

原创文章,发布者:酷番叔,转转请注明出处:https://cloud.kd.cn/ask/8954.html

(0)
酷番叔酷番叔
上一篇 2025年7月28日 01:55
下一篇 2025年7月28日 02:11

相关推荐

  • 修改文件权限怎么做

    在Linux系统中,文件的ctime(change time)记录文件元数据(如权限、所有权等)或内容最后一次被修改的时间,默认情况下,用户无法直接修改ctime,因为它由内核自动管理,但通过特定操作可间接更新或强制修改它,以下是详细方法:理解ctime的特性ctime的自动更新机制:当以下操作发生时,ctim……

    2025年6月12日
    17600
  • Linux插U盘真能自动识别吗?

    自动挂载(适用于主流桌面环境)物理连接将U盘插入USB接口(USB 2.0/3.0均可)系统通常会在5秒内完成以下动作:内核检测设备并加载驱动(usb-storage模块)桌面环境(GNOME/KDE等)自动挂载U盘到/media/用户名/磁盘标签目录在文件管理器侧边栏显示可访问的U盘图标访问数据通过文件管理器……

    2025年7月26日
    11900
  • CentOS/RHEL 7+淘汰在即,如何应对必知?

    在Linux系统中安装libstdc++(GNU C++标准库)通常通过包管理器完成,不同发行版的命令有所差异,以下是详细步骤:安装前的检查确认是否已安装执行以下命令检查现有版本:strings /usr/lib*/libstdc++.so.6 | grep GLIBCXX若输出包含类似GLIBCXX_3.4……

    2025年6月19日
    14200
  • 切换设置竟无需重启?

    在Linux系统中,图形用户界面(GUI)和命令行界面(CLI)是两种核心交互方式,命令行界面(又称终端或TTY)提供了更高效的系统控制能力,尤其适合执行批量任务、系统管理或资源受限场景,以下是切换到命令行界面的详细方法,适用于主流Linux发行版(如Ubuntu、CentOS、Fedora等):方法1:快捷键……

    2025年7月15日
    14500
  • linux 如何查显卡类型

    Linux 中,可使用 lspci | grep -i vga 或 glxinfo | grep “OpenGL vendor string”

    2025年8月19日
    10800

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

联系我们

400-880-8834

在线咨询: QQ交谈

邮件:HI@E.KD.CN

关注微信