如何快速提取data.txt第2、4、5列?

方法1:使用 cut 命令(简单分隔符场景)

适用场景:列由固定分隔符(如逗号、制表符)分隔,且列位置连续。
命令格式

cut -d '分隔符' -f 列序号列表 文件名

示例

# 提取第1到第3列(分隔符为制表符,默认)
cut -f 1-3 data.txt

注意

  • -d 指定分隔符(默认制表符),-f 指定列号(支持1,3,52-5格式)。
  • 缺点:无法处理空格等不固定分隔符。

方法2:使用 awk 命令(灵活处理复杂格式)

适用场景:分隔符不固定、需条件过滤或非连续列。
命令格式

awk -F '分隔符' '{print $列1 $列2 ...}' 文件名

示例

# 提取第1列和第3列(分隔符为空格或制表符)
awk '{print $1, $3}' data.txt
# 提取第2列和第4列(分隔符为冒号)
awk -F ':' '{print $2, $4}' /etc/passwd
# 结合条件:仅当第3列大于10时输出第1列和第2列
awk '$3 > 10 {print $1, $2}' data.csv

优势

  • -F 支持正则表达式(如-F "[,:]"表示逗号或冒号)。
  • 列号用加数字表示($1为第一列),OFS变量可自定义输出分隔符(如awk 'BEGIN{OFS=";"} {...}')。

方法3:使用 paste + 循环(合并多个命令的输出)

适用场景:需从不同命令或非连续列组合数据。
示例

# 合并ls命令的第1列(文件名)和第5列(大小)
ls -l | awk '{print $1}' > col1.txt
ls -l | awk '{print $5}' > col5.txt
paste col1.txt col5.txt

简化写法

paste <(ls -l | awk '{print $1}') <(ls -l | awk '{print $5}')

方法4:使用 datamash 工具(结构化数据处理)

适用场景:需高级表格操作(需安装:sudo apt install datamash)。
示例

# 提取第1列和第3列(分隔符为空格)
datamash -t ' ' cut 1,3 data.txt

总结与建议

方法 最佳场景 优势
cut 简单分隔符、连续列 语法简洁,执行速度快
awk 复杂分隔符、条件过滤、非连续列 功能强大,灵活度高
paste 合并多命令输出 适合管道操作
datamash 结构化数据的高级操作 支持统计、排序等扩展功能

安全提示

  • 处理用户输入文件时,避免使用-i原地修改参数,建议先备份。
  • 对未知文件先用head预览结构(如head -n 5 file)。

引用说明
本文方法参考GNU Coreutils官方文档(cut、awk)及Linux man手册,实践前建议通过man cutman awk查看系统帮助。

原创文章,发布者:酷番叔,转转请注明出处:https://cloud.kd.cn/ask/8954.html

(0)
酷番叔酷番叔
上一篇 3小时前
下一篇 2小时前

相关推荐

  • 如何快速获取设备标识符?

    在Linux系统中,mount命令是管理存储设备的核心工具,用于将外部存储设备(如硬盘、U盘、ISO镜像等)挂载到目录树中,使数据可访问,以下为详细使用指南:mount命令基础基本语法mount [选项] [设备源] [挂载点]设备源:如 /dev/sdb1(物理分区)、/path/to/image.iso(镜……

    2025年7月7日
    1700
  • Linux如何打开Shell?有哪些方法?

    图形界面(GUI)打开方式通过应用程序菜单GNOME桌面(Ubuntu/Fedora等):点击屏幕左上角”活动” → 搜索”Terminal”或”终端” → 点击图标启动,快捷键:Ctrl+Alt+T(多数发行版默认),KDE Plasma桌面(Kubuntu/KDE Neon):点击左下角”应用菜单” → 搜……

    2025年7月10日
    1500
  • MagicLinux如何快速登录?,中文Linux登录有妙招?,图形命令双模式怎么进?,登录MagicLinux只需几步?,中文系统登录指南在哪?

    图形界面登录(适用于桌面用户)启动系统开机后等待系统加载,进入 LightDM 登录管理器(MagicLinux 默认的图形登录界面),选择用户与桌面环境屏幕中央显示用户列表(如已创建多用户),点击目标用户名,输入密码(密码输入时默认隐藏),右上角可选桌面环境(如 KDE Plasma、Xfce 等,Magic……

    2025年7月4日
    1700
  • 编译Linux内核很难吗?

    编译自定义内核是优化系统性能、启用新硬件支持或学习 Linux 核心机制的关键技能,以下是详细步骤,适用于主流发行版(Ubuntu/Debian/CentOS/Fedora),操作需终端权限,请谨慎执行,准备工作安装编译工具链安装必备的开发工具和库:# Ubuntu/Debiansudo apt update……

    2025年7月15日
    1300
  • Linux批量改名怎样又快又稳?

    使用 rename 命令(推荐)rename 是专为批量重命名设计的工具,支持正则表达式,语法简洁高效,基本语法:rename 's/旧内容/新内容/' 匹配模式场景示例:替换固定字符串(如将 file_old.txt 改为 file_new.txt):rename 's/old/new……

    2025年7月17日
    1300

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

联系我们

400-880-8834

在线咨询: QQ交谈

邮件:HI@E.KD.CN

关注微信