如何完美复制文件并保留所有属性?

基础命令:cp(最常用)

适用场景:本地快速复制单个文件或中小型目录。
优势:系统内置,无需安装;操作简单。
常用参数

  • -r:递归复制目录(必需)
  • -v:显示复制进度(verbose)
  • -p:保留文件属性(权限、时间戳)
  • -u:仅复制源文件中更新的部分(增量复制)

示例

# 递归复制目录(仅更新修改过的文件)
cp -rupv /data/ /backup/

效率提示

  • 复制大量小文件时,先用tar打包再复制(见下文)比直接cp -r更快。
  • 避免复制软链接指向的原文件:添加 -P 参数(默认会复制原文件)。

高效工具:rsync(远程/本地均适用)

适用场景:大型目录、增量备份、网络传输(如远程服务器同步)。
优势:增量复制(仅传输变化部分)、断点续传、压缩传输、保留文件属性
安装sudo apt install rsync(Debian/Ubuntu)或 sudo yum install rsync(CentOS/RHEL)

核心参数

  • -a:归档模式(保留权限等属性,递归复制)
  • -z:压缩传输(节省带宽)
  • --progress:显示实时进度
  • --delete:同步删除目标端多余文件

示例

# 本地复制(增量同步目录)
rsync -az --progress /source/ /destination/
# 远程复制(通过SSH)
rsync -azP user@remote:/path/to/source/ /local/destination/

进阶技巧

  • 限速传输:--bwlimit=5000(单位KB/s,避免带宽占满)
  • 排除文件:--exclude="*.tmp"
  • 后台运行:搭配 nohupscreen 防止中断

处理海量小文件:tar + 管道

适用场景:复制数百万个小文件(如日志、代码库),速度比 cp 快数倍。
原理:通过管道边打包边解压,减少磁盘I/O操作。

示例

# 本地复制目录(保留属性)
tar -cf - /source/ | (cd /destination/ && tar -xf -)
# 远程复制(通过SSH)
tar -czf - /source/ | ssh user@remote "tar -xzf - -C /destination/"

优势

  • 避免频繁磁盘寻址,大幅提升小文件复制效率。
  • 支持压缩(-z 使用gzip / -j 使用bzip2)节省传输时间。

块级复制:dd(磁盘/分区克隆)

适用场景:整块磁盘或分区的高精度复制(如备份系统盘)。
注意:操作不当会导致数据丢失!务必确认目标路径。

示例

# 复制整个磁盘(sda到sdb)
dd if=/dev/sda of=/dev/sdb bs=4M status=progress
# 生成磁盘镜像文件
dd if=/dev/sda of=disk.img bs=4M conv=noerror,sync

参数解析

  • bs=4M:设置块大小(提升大文件效率)
  • status=progress:显示进度(较新版本支持)
  • conv=noerror,sync:忽略错误并填充空块

实时监控复制进度

  1. pv 工具(管道查看器)
    安装:sudo apt install pv
    示例:

    # 监控文件复制进度
    pv source.iso > /backup/source.iso
    # 结合tar监控目录复制
    tar -cf - /data/ | pv | (cd /backup/ && tar -xf -)
  2. rsync --progress
    如前述示例,实时显示每个文件传输进度。


性能优化与避坑指南

  1. 选择合适工具

    • 小文件 → tar 管道
    • 大文件/远程同步 → rsync
    • 磁盘克隆 → dd
  2. 避免覆盖风险
    使用 -i 参数(如 cp -i)或 rsync --backup 防止误覆盖重要文件。

  3. 处理特殊文件

    • 复制软链接:cp -Prsync -l(不跟踪原文件)
    • 保留SELinux属性:rsync -aZcp --preserve=context
  4. 提升速度技巧

    • 关闭日志:对目标文件系统使用 mount -o noatime
    • 增加缓冲区:ddtar 中调大 bs 值(如 bs=128M

总结建议

场景 推荐命令 关键优势
日常文件/目录复制 cp -rpv 简单快速
大型目录/远程同步 rsync -azP 增量备份、断点续传
海量小文件 tar + 管道 减少I/O,速度提升显著
磁盘/分区克隆 dd 块级精确复制

重要提示

  • 操作前用 lsblkdf -h 确认路径,避免覆盖错误目标。
  • 生产环境务必先测试!可使用 --dry-run 参数(如 rsync -anv)模拟运行。

通过结合场景选择工具,Linux复制操作可快至原来的2-5倍,对于TB级数据,建议先用小样本测试,再调整参数(如 rsync--bwlimitddbs 值)平衡速度与系统负载。


引用说明

  • GNU Coreutils 手册(cpdd 命令)https://www.gnu.org/software/coreutils/
  • Rsync 官方文档 https://rsync.samba.org/documentation.html
  • Linux 内核文档(文件系统优化)https://www.kernel.org/doc/html/latest/

原创文章,发布者:酷番叔,转转请注明出处:https://cloud.kd.cn/ask/6685.html

(0)
酷番叔酷番叔
上一篇 2025年7月8日 14:08
下一篇 2025年7月8日 14:35

相关推荐

  • Linux程序正确链接静态库的方法、步骤及注意事项有哪些?

    在Linux开发中,静态库是一组预先编译好的目标文件(.o文件)的集合,以.a(archive)格式存储,链接静态库时,链接器会将库中的代码完整复制到可执行文件中,因此生成的程序不依赖外部库文件,但体积会相对较大,本文将详细介绍在Linux环境下如何创建、链接静态库,以及相关注意事项,静态库的创建静态库的创建通……

    2025年9月24日
    8200
  • linux如何开启dhcp

    Linux中,可以使用命令sudo systemctl start dhcpd或sudo service dhcpd start来开启

    2025年8月16日
    7700
  • Linux中解压gz文件,具体命令和操作步骤是什么?

    在Linux系统中,gz文件是通过gzip工具压缩的文件格式,广泛应用于数据压缩和传输场景,解压gz文件主要依赖gzip或gunzip命令,本文将详细介绍解压gz文件的方法、常用选项、不同场景操作及常见问题解决,基本解压方法Linux中最常用的解压gz文件命令是gunzip,它是gzip的硬链接,功能与gzip……

    2025年9月17日
    8500
  • 如何查看Linux系统的内存大小?

    在Linux系统中,了解内存大小是系统管理和性能优化的基础,通过多种命令和文件可以快速获取内存信息,以下是详细方法及解读,使用free命令查看内存概况free是最常用的内存查看命令,默认以KB为单位显示内存使用情况,支持多种参数调整输出格式,基本用法free -h # 以人类可读格式(GB/MB/KB)显示输出……

    2025年9月15日
    7100
  • Linux下如何查看DB2数据库的端口号?

    在Linux系统中查看DB2数据库的端口号是数据库管理和网络配置中的常见需求,端口号的正确配置直接影响客户端连接、应用程序访问以及防火墙策略的制定,DB2的端口配置涉及实例级和数据库级两个层面,不同场景下可能需要查看不同类型的端口,例如实例管理端口(SVCENAME)、数据库连接端口、协调端口等,本文将详细介绍……

    2025年9月25日
    5900

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

联系我们

400-880-8834

在线咨询: QQ交谈

邮件:HI@E.KD.CN

关注微信