数据库不复制会怎样？

数据库复制主要用于提高系统可用性（避免单点故障）、实现负载均衡（分担读请求压力）以及支持灾难恢复，它还能优化地理分布用户的访问速度。

数据库复制是一种关键技术，用于在多台服务器之间创建和维护数据库的相同副本，它的核心目的是提高数据的可用性、可靠性和性能，想象一下，你有一份重要的文件，为了确保它不会丢失或损坏，并且能让更多人同时快速查阅，你会制作几份副本存放在不同的地方,数据库复制就是这个原理在数据库层面的实现。

高可用性 (High Availability): 这是最主要的原因，如果主数据库服务器发生硬件故障、软件崩溃或进行计划维护，复制架构中的备用服务器（副本）可以立即接管服务，最大限度地减少甚至消除应用程序的停机时间,保证业务连续性。
灾难恢复 (Disaster Recovery): 将副本部署在物理上不同的地理位置（异地），可以保护数据免受区域性灾难（如火灾、洪水、地震）的影响，即使主数据中心完全瘫痪,异地副本也能用于恢复服务。
负载均衡 (Load Balancing): 对于读多写少的应用（如内容网站、报表系统），可以将大量的只读查询（SELECT操作）分散到多个副本服务器上执行，这显著减轻了主数据库的负担,提高了整体系统的吞吐量和响应速度。
数据分析与报表 (Analytics & Reporting): 在副本上运行复杂的分析查询或生成报表，可以避免这些资源密集型操作干扰主数据库上关键的事务处理（OLTP）性能。
地理分布 (Geographical Distribution): 将副本部署在靠近用户的地理位置，可以减少网络延迟,为不同区域的用户提供更快的访问体验。

数据库复制的主要类型

主从复制 (Master-Slave / Source-Replica Replication):
- 原理: 一个数据库服务器充当“主节点”（Master/Source），负责处理所有写入操作（INSERT, UPDATE, DELETE），一个或多个其他服务器充当“从节点”（Slave/Replica），它们持续地从主节点接收数据变更（通常通过读取主节点的二进制日志 – Binary Log / Write-Ahead Log – WAL），并在本地应用这些变更,从而保持与主节点数据一致。
- 特点: 简单、常见，写入只能在主节点进行，从节点通常只用于读操作（但技术上也可配置为可写，需谨慎处理冲突），故障转移需要手动或借助工具（如MHA, Orchestrator）将某个从节点提升为主节点。
主主复制 (Master-Master / Multi-Source Replication):
- 原理: 两个或多个数据库服务器都配置为既是主节点又是从节点，任何节点都可以接受写入操作,并将自己的变更复制到其他节点。
- 特点: 理论上提供了更高的写入可用性（可在任一节点写入），但实现复杂，极易发生数据冲突（两个节点同时修改了同一行数据），需要非常谨慎的应用程序设计（如分片）或冲突检测与解决机制，通常只用于特定场景,不推荐作为通用方案。
级联复制 (Cascade Replication):
- 原理: 一个主节点复制给一个从节点（A），然后这个从节点（A）再作为“主节点”复制给其他从节点（B, C, …）。
- 特点: 可以减少主节点的网络带宽压力（特别是当有大量从节点时），但增加了数据延迟（变更需要经过中间节点传播），且中间节点（A）故障会影响其下游节点（B, C）。
逻辑复制 vs. 物理复制:
- 物理复制 (Physical Replication): 在磁盘块级别复制数据变更，副本是主库在磁盘上的逐块镜像，通常更快，但要求主从节点操作系统、数据库版本甚至文件系统高度一致，常见于PostgreSQL（流复制）、Oracle Data Guard。
- 逻辑复制 (Logical Replication): 复制的是SQL语句（如INSERT, UPDATE）或行级变更的逻辑表示，更灵活，允许主从节点版本不同、甚至跨不同数据库引擎（通过工具），可以选择性复制特定表或数据库，常见于MySQL（基于Binlog的复制）、PostgreSQL（发布/订阅）。

数据库复制是如何工作的？（通用流程）

虽然不同数据库系统实现细节不同,但核心流程相似：

主节点记录变更: 当主节点执行一个修改数据的操作（事务提交）时，它会将这个操作（SQL语句或行变更信息）记录到其事务日志中（MySQL的Binary Log, PostgreSQL的Write-Ahead Log – WAL）。
从节点连接与请求: 从节点启动后，会连接到主节点，并告知主节点它当前已经复制到的位置（日志文件名称和偏移量，或LSN – Log Sequence Number）。
主节点发送日志: 主节点根据从节点提供的位置信息，从其事务日志中读取后续的变更事件,并通过网络发送给从节点。
从节点接收与中继: 从节点接收到这些变更事件，会先将它们写入自己的中继日志 (Relay Log) 中（MySQL特有概念，PostgreSQL等可能直接应用）。
从节点应用变更: 从节点上的一个或多个复制应用线程 (SQL Thread / Apply Worker) 读取中继日志（或直接读取接收到的WAL），并按顺序执行这些变更操作（重放SQL语句或应用行变更）,从而更新从节点本地的数据。
状态报告: 从节点会定期向主节点报告其当前应用到的位置,主节点据此监控复制进度。

关键概念：

异步复制 (Asynchronous Replication): 主节点提交事务后，无需等待从节点确认收到并应用变更，就立即向客户端返回成功，性能最好，但存在数据丢失风险（主节点崩溃时，未传送到从节点的变更会丢失）。
半同步复制 (Semi-Synchronous Replication): 主节点提交事务时，会等待至少一个从节点确认已收到变更事件（不一定已应用）后，才向客户端返回成功，平衡了性能和数据安全性（降低丢失风险）。
同步复制 (Synchronous Replication): 主节点提交事务时，必须等待所有配置的从节点都确认已应用变更后，才向客户端返回成功，提供最高的数据一致性保证，但会显著增加事务延迟，对网络要求极高,实际应用较少。
复制延迟 (Replication Lag): 从节点上的数据相对于主节点存在的时间差，受网络带宽、从节点负载、大事务等因素影响,是监控复制健康状态的关键指标。

常用数据库复制配置命令示例 (重要提示：具体命令和步骤因数据库版本和配置而异，请务必查阅官方文档)

MySQL / MariaDB (主从复制 – 基于Binlog)

主节点配置 (my.cnf):

[mysqld]
server-id = 1          # 唯一服务器ID
log_bin = /var/log/mysql/mysql-bin.log  # 启用二进制日志
binlog_format = ROW    # 推荐使用ROW格式，更安全
expire_logs_days = 10  # 自动清理旧Binlog
max_binlog_size = 100M # 单个Binlog文件大小
# 可选：指定需要复制的数据库
# binlog_do_db = your_database_name
# 或指定忽略的数据库
# binlog_ignore_db = mysql
# binlog_ignore_db = information_schema
# binlog_ignore_db = performance_schema

重启MySQL服务使配置生效。

主节点上创建复制用户:

CREATE USER 'replica_user'@'slave_server_ip' IDENTIFIED BY 'strong_password';
GRANT REPLICATION SLAVE ON *.* TO 'replica_user'@'slave_server_ip';
FLUSH PRIVILEGES;

主节点上获取当前Binlog状态:
```
SHOW MASTER STATUS;
```
记录输出中的 File (如 mysql-bin.000001) 和 Position (如 107),从节点需要这个信息。

从节点配置 (my.cnf):

[mysqld]
server-id = 2          # 唯一服务器ID，必须与主节点不同
relay_log = /var/log/mysql/mysql-relay-bin.log # 中继日志位置
read_only = ON         # 推荐将从节点设为只读
# 可选：如果只复制特定库
# replicate_do_db = your_database_name

重启MySQL服务使配置生效。

从节点上配置复制源:

CHANGE MASTER TO
MASTER_HOST = 'master_server_ip',
MASTER_USER = 'replica_user',
MASTER_PASSWORD = 'strong_password',
MASTER_LOG_FILE = 'mysql-bin.000001', -- 替换为SHOW MASTER STATUS得到的File
MASTER_LOG_POS = 107;                 -- 替换为SHOW MASTER STATUS得到的Position

从节点上启动复制:

START SLAVE; -- 在较新版本中，推荐使用 START REPLICA;

检查从节点复制状态:
```
SHOW SLAVE STATUS\G -- 或 SHOW REPLICA STATUS\G
```
关键字段：
- Slave_IO_Running: Yes (IO线程正常运行,负责接收日志)
- Slave_SQL_Running: Yes (SQL线程正常运行,负责应用日志)
- Seconds_Behind_Master: 0 或较小的数字 (表示复制延迟很小)
- Last_IO_Error, Last_SQL_Error: 应为空 (表示没有错误)

PostgreSQL (流复制 – 基于WAL)

主节点配置 (postgresql.conf):

wal_level = replica        # 或 'logical' 用于逻辑复制
max_wal_senders = 10       # 允许的最大WAL发送进程数（>=从节点数）
wal_keep_size = 1GB        # 或使用 wal_keep_segments (旧版本)，保留多少WAL文件供复制
# 监听所有IP或特定IP
listen_addresses = '*'     # 或 'localhost, master_ip'

主节点配置 (pg_hba.conf): 添加一行允许从节点连接复制

# TYPE  DATABASE        USER        ADDRESS                 METHOD
host    replication     replica_user  slave_server_ip/32     scram-sha-256 # 或 md5/trust (不推荐)

重启PostgreSQL服务使配置生效。

主节点上创建复制用户:

CREATE USER replica_user WITH REPLICATION ENCRYPTED PASSWORD 'strong_password';

从节点初始数据同步 (使用 pg_basebackup): 在从节点服务器上执行

pg_basebackup -h master_server_ip -U replica_user -D /var/lib/pgsql/XX/data -P -v -R --wal-method=stream
# -D 指定从节点数据目录
# -P 显示进度
# -v 详细输出
# -R 自动创建recovery.conf (或主配置中primary_conninfo)
# --wal-method=stream 在备份时同时流式传输WAL

这会清空从节点的数据目录并用主节点的物理备份填充。

从节点配置 (postgresql.conf): (pg_basebackup -R 已处理主要配置)
```
hot_standby = on          # 允许在恢复期间执行只读查询
```
从节点启动: 启动从节点的PostgreSQL服务,它会自动连接到主节点开始流复制。
检查复制状态:
- 在主节点上:
```
SELECT * FROM pg_stat_replication;
```
  查看 usename, application_name, state (streaming), sent_lsn, write_lsn, flush_lsn, replay_lsn, sync_state (async/sync), client_addr。
- 在从节点上:
```
SELECT pg_is_in_recovery(); -- 返回 t (true) 表示处于恢复/复制状态
SELECT * FROM pg_stat_wal_receiver;
```

Microsoft SQL Server (事务复制)

SQL Server复制配置通常通过SQL Server Management Studio (SSMS) 图形界面完成更直观，但也可用T-SQL,步骤简述：

配置分发服务器: (可以是发布服务器自身或独立服务器)
创建发布 (Publication): 在发布服务器上选择要复制的数据库、对象（表、存储过程等）和复制的类型（快照、事务、合并）。
创建订阅 (Subscription): 在发布服务器或订阅服务器上创建指向订阅服务器的订阅（推送订阅或请求订阅）。
初始化订阅: 生成初始快照并应用到订阅服务器。

T-SQL 示例 (简化):

-- 在发布服务器上启用分发 (假设本地分发)
USE master;
EXEC sp_adddistributor @distributor = N'PublisherServer';
EXEC sp_adddistributiondb @database = N'distribution';
GO
-- 在发布数据库上启用发布
USE YourPublicationDB;
EXEC sp_replicationdboption @dbname = N'YourPublicationDB', @optname = N'publish', @value = N'true';
GO
-- 添加快照代理
EXEC sp_addpublication_snapshot @publication = N'YourPublication', @frequency_type = 4; -- 4=自动
GO
-- 添加事务发布
EXEC sp_addpublication
    @publication = N'YourPublication',
    @status = N'active',
    @repl_freq = N'continuous', -- 连续事务复制
    @description = N'Transactional publication';
GO
-- 向发布中添加项目 (表)
EXEC sp_addarticle
    @publication = N'YourPublication',
    @article = N'YourTable',
    @source_owner = N'dbo',
    @source_object = N'YourTable';
GO
-- 添加订阅 (推送订阅示例)
EXEC sp_addsubscription
    @publication = N'YourPublication',
    @subscriber = N'SubscriberServer',
    @destination_db = N'YourSubscriptionDB',
    @subscription_type = N'Push';
GO
EXEC sp_addpushsubscription_agent
    @publication = N'YourPublication',
    @subscriber = N'SubscriberServer',
    @subscriber_db = N'YourSubscriptionDB',
    @job_login = N'domain\agent_account', @job_password = 'agent_password';
GO

重要注意事项

版本兼容性: 主从节点的数据库软件版本通常需要兼容，主节点版本一般应等于或高于从节点版本,务必查阅官方文档。
网络: 稳定、低延迟、足够带宽的网络是保证复制性能和低延迟的关键。
安全性:
- 使用强密码进行复制账户认证。
- 限制复制账户的权限（仅授予必要的复制权限）。
- 在可能的情况下，对主从节点之间的网络通信进行加密（TLS/SSL）。
监控: 持续监控复制状态（SHOW SLAVE STATUS, pg_stat_replication, SQL Server复制监视器）、延迟（Seconds_Behind_Master, pg_stat_wal_receiver）、错误日志至关重要,设置告警。
备份: 即使有复制，定期备份主数据库（和/或从数据库）仍然是灾难恢复的最后一道防线。
测试: 定期测试故障转移流程,确保在真正需要时能顺利切换。
数据一致性: 理解所选复制类型（异步/半同步/同步）带来的数据一致性和性能之间的权衡。
冲突处理 (主主复制): 如果使用主主复制,必须设计健壮的冲突检测和解决策略。

数据库复制是现代数据库架构的基石，为业务提供了至关重要的高可用性、灾难恢复能力和可扩展性，理解复制的原理、不同类型及其适用场景，并掌握目标数据库系统的具体配置命令和最佳实践，对于构建和维护一个健壮、可靠的数据服务至关重要，配置复制时，务必参考官方文档的最新版本，并充分考虑安全性、监控和测试。

引用说明：

本文中关于数据库复制的基本概念、类型、工作原理和注意事项，综合了关系型数据库（如MySQL, PostgreSQL, SQL Server）的通用原理和最佳实践。
具体的配置命令示例主要参考了以下官方文档（截至知识截止日期）：
- MySQL: https://dev.mysql.com/doc/refman/8.0/en/replication.html
- PostgreSQL: https://www.postgresql.org/docs/current/warm-standby.html (流复制), https://www.postgresql.org/docs/current/logical-replication.html
- SQL Server: https://learn.microsoft.com/en-us/sql/relational-databases/replication/sql-server-replication?view=sql-server-ver16
实际配置时，请务必查阅您所使用的特定数据库版本的官方文档，因为命令、参数和最佳实践可能会随版本更新而变化。

原创文章，发布者：酷番叔，转转请注明出处：https://cloud.kd.cn/ask/6636.html