如何快速提取data.txt第2、4、5列?

方法1:使用 cut 命令(简单分隔符场景)

适用场景:列由固定分隔符(如逗号、制表符)分隔,且列位置连续。
命令格式

cut -d '分隔符' -f 列序号列表 文件名

示例

# 提取第1到第3列(分隔符为制表符,默认)
cut -f 1-3 data.txt

注意

  • -d 指定分隔符(默认制表符),-f 指定列号(支持1,3,52-5格式)。
  • 缺点:无法处理空格等不固定分隔符。

方法2:使用 awk 命令(灵活处理复杂格式)

适用场景:分隔符不固定、需条件过滤或非连续列。
命令格式

awk -F '分隔符' '{print $列1 $列2 ...}' 文件名

示例

# 提取第1列和第3列(分隔符为空格或制表符)
awk '{print $1, $3}' data.txt
# 提取第2列和第4列(分隔符为冒号)
awk -F ':' '{print $2, $4}' /etc/passwd
# 结合条件:仅当第3列大于10时输出第1列和第2列
awk '$3 > 10 {print $1, $2}' data.csv

优势

  • -F 支持正则表达式(如-F "[,:]"表示逗号或冒号)。
  • 列号用加数字表示($1为第一列),OFS变量可自定义输出分隔符(如awk 'BEGIN{OFS=";"} {...}')。

方法3:使用 paste + 循环(合并多个命令的输出)

适用场景:需从不同命令或非连续列组合数据。
示例

# 合并ls命令的第1列(文件名)和第5列(大小)
ls -l | awk '{print $1}' > col1.txt
ls -l | awk '{print $5}' > col5.txt
paste col1.txt col5.txt

简化写法

paste <(ls -l | awk '{print $1}') <(ls -l | awk '{print $5}')

方法4:使用 datamash 工具(结构化数据处理)

适用场景:需高级表格操作(需安装:sudo apt install datamash)。
示例

# 提取第1列和第3列(分隔符为空格)
datamash -t ' ' cut 1,3 data.txt

总结与建议

方法 最佳场景 优势
cut 简单分隔符、连续列 语法简洁,执行速度快
awk 复杂分隔符、条件过滤、非连续列 功能强大,灵活度高
paste 合并多命令输出 适合管道操作
datamash 结构化数据的高级操作 支持统计、排序等扩展功能

安全提示

  • 处理用户输入文件时,避免使用-i原地修改参数,建议先备份。
  • 对未知文件先用head预览结构(如head -n 5 file)。

引用说明
本文方法参考GNU Coreutils官方文档(cut、awk)及Linux man手册,实践前建议通过man cutman awk查看系统帮助。

原创文章,发布者:酷番叔,转转请注明出处:https://cloud.kd.cn/ask/8954.html

(0)
酷番叔酷番叔
上一篇 2025年7月28日 01:55
下一篇 2025年7月28日 02:11

相关推荐

  • Linux如何修改IP包?具体操作步骤有哪些?

    在Linux系统中修改IP包是一项常见的网络操作,广泛应用于网络测试、安全防护、NAT转换、流量控制等场景,IP包的修改可以在网络层(IP层)或传输层(TCP/UDP层)进行,涉及源/目标IP地址、端口号、协议字段、TTL值等内容的调整,本文将详细介绍Linux环境下修改IP包的多种方法,包括用户空间工具、内核……

    2025年8月28日
    3600
  • linux如何创建sql脚本

    Linux 中,可使用文本编辑器(如 vi、nano)编写 SQL 语句并保存为 .

    2025年8月17日
    2700
  • 如何修复Ubuntu/Debian系统启动失败?

    在Linux系统中,查看版本号是管理服务器、安装软件或排查问题的基础操作,不同发行版(如Ubuntu、CentOS、Debian)的命令略有差异,以下是经过验证的6种专业方法,涵盖通用命令和发行版专属方案:通用方法:通过lsb_release命令(推荐)适用于大多数主流发行版,显示标准版本信息:lsb_rele……

    2025年7月9日
    4200
  • 离职或留下?你该选哪条路

    在Linux系统中,.sh文件是Shell脚本(Shell Script),本质是包含一系列Linux命令的文本文件,用户通常需要“运行”而非字面意义的“打开”它来执行任务,以下是详细操作指南:运行.sh文件的3种核心方法方法1:直接通过解释器执行(无需权限)bash 文件名.shsh 文件名.sh原理:调用b……

    2025年7月20日
    4800
  • 如何高效调试Linux程序?步骤、工具与实战全解析

    调试Linux程序是开发过程中确保代码正确性和稳定性的关键环节,通过系统化的调试方法可以快速定位并解决问题,本文将从环境准备、工具使用、技巧实践等方面详细介绍Linux程序调试的完整流程,调试前的环境准备调试前需确保程序包含调试信息,并在系统中启用必要的调试支持,使用gcc或g++编译程序时需添加-g选项,生成……

    2025年9月30日
    1600

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

联系我们

400-880-8834

在线咨询: QQ交谈

邮件:HI@E.KD.CN

关注微信