亿级数据高效写入MySQL：从底层原理到分布式落地全方案

原创于 2025-11-26 18:00:00 发布 · 671 阅读

21 ·

CC 4.0 BY-SA版权

文章标签：

#mysql #分布式 #数据库

Java 实战录同时被 2 个专栏收录

24 篇文章

订阅专栏

学习与工具

23 篇文章

订阅专栏

在大数据处理场景中，"亿级数据如何快速写入MySQL"是面试官高频考察的核心问题，也是业务落地中极具挑战性的技术难点。本文将从需求拆解、底层原理分析入手，结合分布式架构设计与参数调优实践，提供一套可落地的10亿级数据写入解决方案——既覆盖单表性能瓶颈的数学计算，也包含分布式任务调度的工程细节，同时整合LOAD DATA INFILE、临时表去重等实战技巧，帮助开发者系统性解决海量数据写入难题。

一、需求拆解与核心挑战

在设计方案前，必须先明确业务约束条件——不同的数据源、数据格式和可靠性要求，会直接影响技术选型。结合行业常见场景，10亿级数据写入MySQL的典型约束如下：

约束项	具体要求	技术影响
数据规模	10亿条记录，单条1KB，总容量约931GB	需拆分存储，无法单表承载
数据来源	非结构化用户访问日志，存储于HDFS/S3	需先解析再写入，读取性能影响整体效率
文件形态	已切分为100个有序文件（按后缀标记顺序）	可并行读取，但需保证写入顺序性
可靠性要求	尽量不重复、支持断点续传	需设计幂等机制与进度跟踪方案
目标数据库	MySQL	需兼容InnoDB/MyISAM引擎特性，规避写入瓶颈

基于上述约束，方案设计需突破四大核心挑战：

单表容量瓶颈：MySQL单表无法承载10亿数据，如何通过分库分表平衡性能与维护成本？
写入性能瓶颈：单条插入吞吐量极低，如何通过批量操作与参数调优提升写入效率？
分布式协调难题：100个文件并行处理时，如何避免数据库并发写入冲突，同时保证顺序性？
数据可靠性保障：任务中断后如何断点续传？如何避免重复写入？

二、底层原理：为什么单表不能存10亿数据？

要解决分库分表问题，首先需要理解MySQL单表容量的数学边界——这并非经验值，而是由B+树索引结构决定的性能临界点。

2.1 B+树索引的性能计算公式

MySQL InnoDB的主键索引（聚簇索引）采用B+树结构，其查询/插入性能直接取决于树的层数（越少性能越好）。关键参数如下：

页大小：InnoDB默认16KB（叶子节点与非叶子节点一致）
叶子节点存储：单条数据1KB时，每个叶子节点可存16KB/1KB=16条数据
非叶子节点存储：仅需存储主键（BigInt占8字节）+ 指针（InnoDB默认6字节），单条占14字节，因此每个非叶子节点可存16KB*1024/14≈1170个索引项

基于上述参数，可计算不同B+树层数的最大数据承载量：

2层B+树：1个根节点（1170个索引项）→ 1170个叶子节点 → 1170×16=18,720条数据
3层B+树：1个根节点→1170个二级节点→1170×1170个叶子节点 → 1170×1170×16≈2190万条数据
4层B+树：在3层基础上再增加一级 → 1170³×16≈256亿条数据

2.2 单表容量的合理阈值

虽然4层B+树可承载256亿数据，但层数增加会导致磁盘IO次数上升：3层树查询仅需3次IO，4层则需4次——在高并发场景下，这会导致性能下降30%以上。因此行业共识是：

单表推荐容量：2000万条以内（确保B+树为3层）
本方案分表设计：10亿数据需拆分100张表（每张表1000万条，预留50%冗余空间）

三、核心方案：从数据读取到写入的全链路优化

3.1 数据读取：平衡速度与易用性的选择

100个10GB级文件的读取效率，直接影响整体写入进度。常见的Java文件读取方式性能对比如下（基于3.4GB文件测试）：

读取方式	耗时	优缺点	适用场景
Files.readAllBytes	OOM异常	一次性加载到内存，速度快但内存溢出风险高	小文件（<1GB）
Scanner逐行读取	57秒	易用性高，但性能极差	调试场景
FileReader+BufferedReader	11秒	支持逐行解析，性能中等	需按行处理日志数据
Java NIO FileChannel	3秒	基于缓冲区，速度最快但不支持逐行拆分	二进制文件或无需行解析场景

方案选择：采用BufferedReader逐行读取
理由：日志数据需按行解析（非结构化转结构化），虽然NIO速度更快，但处理"缓冲区截断行"的逻辑复杂度高；而BufferedReader的11秒/3.4GB读取速度，已能满足需求——整体瓶颈在数据库写入，而非文件读取。

优化技巧：

设置8KB缓冲区（默认4KB）：new BufferedReader(new FileReader(file), 8192)
采用线程池并行读取：100个文件对应100个线程，但需控制并发数（避免HDFS/S3连接耗尽）

3.2 批量写入：吞吐量提升的关键手段

单条INSERT语句的吞吐量约为600条/秒，而批量写入可将吞吐量提升50-100倍。方案设计需关注三个核心点：批量大小计算、事务配置、重试机制。

3.2.1 批量大小的数学计算

批量大小并非越大越好——需结合MySQL的max_allowed_packet参数（默认4MB，最大可设64MB）。计算公式如下：

最佳批量大小 = (max_allowed_packet / 2) / 单条数据大小

以max_allowed_packet=4MB、单条1KB为例：

最佳批量大小 = (4096KB / 2) / 1KB = 2048条

实践建议：初始设为2000条/批次，通过压测调整（如1000-5000条区间），避免因SQL语句过长导致网络传输延迟。

3.2.2 批量写入的代码实现

推荐使用MyBatis的Batch executor或JDBC Batch，前者更易集成到业务系统：

// MyBatis Batch模式示例
@Autowired
private SqlSessionFactory sqlSessionFactory;

public void batchInsert(List<AccessLog> dataList) {
    // 开启Batch模式SqlSession，关闭自动提交
    try (SqlSession sqlSession = sqlSessionFactory.openSession(ExecutorType.BATCH)) {
        AccessLogMapper mapper = sqlSession.getMapper(AccessLogMapper.class);
        int batchSize = 2000;
        int count = 0;
        
        for (AccessLog log : dataList) {
            mapper.insert(log);
            count++;
            // 达到批量大小提交事务
            if (count % batchSize == 0) {
                sqlSession.commit();
                sqlSession.clearCache(); // 避免内存溢出
            }
        }
        // 提交剩余数据
        sqlSession.commit();
    } catch (Exception e) {
        // 批量失败时拆分单条重试
        handleBatchFail(dataList, e);
    }
}

// 批量失败后的单条重试逻辑
private void handleBatchFail(List<AccessLog> dataList, Exception e) {
    try (SqlSession sqlSession = sqlSessionFactory.openSession()) {
        AccessLogMapper mapper = sqlSession.getMapper(AccessLogMapper.class);
        for (AccessLog log : dataList) {
            try {
                mapper.insert(log);
                sqlSession.commit();
            } catch (Exception ex) {
                // 记录失败数据，后续人工处理
                log.error("单条插入失败，数据ID：{}", log.getId(), ex);
            }
        }
    }
}

3.2.3 事务与日志参数调优

InnoDB的事务日志刷新策略对写入性能影响极大，关键参数innodb_flush_log_at_trx_commit的取值对比：

参数值	刷新策略	数据安全性	写入性能	适用场景
1（默认）	每次事务提交刷新到磁盘	最高（无数据丢失）	最低	金融级核心业务
0	每秒刷新一次，事务提交不刷新	较低（宕机丢失1秒数据）	较高	非核心业务，如日志统计
2	事务提交刷新到OS缓存，OS每秒刷盘	中等（OS崩溃丢失1秒数据）	中高	一般业务，需平衡安全与性能

方案选择：非核心业务设为0，核心业务设为2，同时关闭不必要的日志：

-- 临时关闭binlog（导入完成后恢复）
SET sql_log_bin = 0;
-- 关闭外键检查（避免关联校验耗时）
SET foreign_key_checks = 0;
-- 关闭唯一性检查（导入后重建索引时校验）
SET unique_checks = 0;

3.3 分库分表：突破单库写入瓶颈

MySQL单库的写入吞吐量存在上限（HDD约2000 TPS，SSD约5000 TPS），10亿数据需通过分库分表分散压力。方案设计需结合存储硬件特性：

3.3.1 分库分表策略

采用"文件-表-库"的映射关系，确保有序性与负载均衡：

文件映射：按文件后缀（如index_01.txt）分配表索引（如table_01）
表库映射：按表索引取模分配数据库（如table_01→db_01，table_11→db_02）
容量控制：每库10张表，100张表对应10个数据库实例

3.3.2 HDD与SSD的差异化配置

磁盘类型直接决定并发写入能力，需针对性设计：

HDD场景：磁头寻道时间长，不支持多表并发写入 → 每库仅允许1个表写入（单线程顺序写）
SSD场景：无寻道时间，支持多表并发 → 每库允许3-5个表并行写入（通过压测确定最优并发数）

实现技巧：使用Redisson信号量控制单库并发度，示例如下：

// 按数据库ID创建信号量，控制并发写入数
private RedissonClient redissonClient;

public boolean tryAcquireDbLock(int dbIndex, int maxConcurrent) {
    String semaphoreKey = "db_semaphore_" + dbIndex;
    RSemaphore semaphore = redissonClient.getSemaphore(semaphoreKey);
    // 初始化信号量（仅第一次执行）
    semaphore.trySetPermits(maxConcurrent);
    // 非阻塞获取许可，超时时间5秒
    try {
        return semaphore.tryAcquire(5, TimeUnit.SECONDS);
    } catch (InterruptedException e) {
        return false;
    }
}

// 任务完成后释放许可
public void releaseDbLock(int dbIndex) {
    String semaphoreKey = "db_semaphore_" + dbIndex;
    RSemaphore semaphore = redissonClient.getSemaphore(semaphoreKey);
    semaphore.release();
}

3.4 数据可靠性：去重与断点续传方案

10亿级数据写入过程中，任务中断（如服务重启、数据库故障）是常态，需设计完善的可靠性机制。

3.4.1 幂等写入：避免重复数据

采用"任务ID+文件索引+行号"的复合主键设计，确保每条数据唯一：

主键格式：Long id = taskId * 10000000000L + fileIndex * 10000000L + rowNumber
- taskId：区分不同导入任务（避免跨任务重复）
- fileIndex：文件后缀（0-99）
- rowNumber：文件内行号（0-9999999）

写入策略：使用INSERT IGNORE语句，即使重复也不会报错（仅触发警告）：

INSERT IGNORE INTO access_log (id, user_id, access_time, url) 
VALUES (#{id}, #{userId}, #{accessTime}, #{url});

3.4.2 断点续传：基于Redis的进度跟踪

通过Redis记录每个文件的写入进度，任务重启后可从断点继续：

进度存储：使用INCRBY命令记录已成功写入的行数，Key格式为task_progress_{taskId}_{fileIndex}

// 批量写入成功后更新进度
public void updateProgress(int taskId, int fileIndex, int batchSize) {
    String key = "task_progress_" + taskId + "_" + fileIndex;
    redisTemplate.opsForValue().increment(key, batchSize);
}

断点恢复：任务启动时查询Redis获取已写入行数，跳过前面的数据：

// 获取已写入行数，从该位置继续读取
public long getCurrentOffset(int taskId, int fileIndex) {
    String key = "task_progress_" + taskId + "_" + fileIndex;
    return redisTemplate.opsForValue().get(key) == null ? 0 : redisTemplate.opsForValue().get(key);
}

一致性保障：若担心Redis与数据库进度不一致，可消费MySQL binlog（如通过Canal）同步进度，确保最终一致性。

3.5 分布式任务调度：主从协调与负载均衡

当需要多节点并行处理时，需解决任务分配、并发控制与故障转移问题，推荐采用"Zookeeper选主+Kafka消息分发"的架构：

主节点选举：通过Zookeeper Curator框架选举主节点，负责任务分配：
- 主节点职责：扫描待处理文件，按"数据库并发度"分配任务到Kafka Topic
- 故障转移：主节点宕机后，Zookeeper自动选举新主节点，确保任务不中断
任务分发：
- 按数据库分区创建Kafka Topic（如db_01_tasks、db_02_tasks）
- 主节点将文件任务（如file_01→table_01→db_01）发送到对应Topic
从节点消费：
- 从节点订阅对应数据库的Topic，获取任务后执行"读取-解析-写入"流程
- 每个从节点同时处理的任务数不超过CPU核心数（避免线程切换开销）

四、性能测试与落地建议

4.1 不同写入方式的性能对比

基于SSD服务器（8核16GB，MySQL 8.0）的测试数据如下：

写入方式	单批次大小	吞吐量（条/秒）	10亿数据理论耗时	备注
单条INSERT	1	600-800	约347小时	完全不可用
JDBC Batch	2000	30,000-50,000	约5.6-9.3小时	常规方案
MyBatis Batch	2000	40,000-60,000	约4.6-7.7小时	业务系统推荐
LOAD DATA INFILE	10万行/文件	120,000-150,000	约1.9-2.3小时	无解析需求时最优

关键结论：若数据无需复杂解析（如已为CSV格式），优先使用LOAD DATA INFILE，性能比批量INSERT高3倍以上，示例语句：

LOAD DATA INFILE '/data/access_log_01.csv'
INTO TABLE access_log
FIELDS TERMINATED BY ',' ENCLOSED BY '"'
LINES TERMINATED BY '\n'
IGNORE 1 ROWS -- 跳过表头
(id, user_id, access_time, url);

4.2 落地注意事项

索引处理：导入前删除非主键索引，导入后重建——索引维护占写入耗时的40%以上：

-- 导入前删除索引
DROP INDEX idx_user_id ON access_log;
-- 导入后重建索引（后台执行，不阻塞读写）
CREATE INDEX idx_user_id ON access_log(user_id) WITH ONLINE = ON;

硬件选择：SSD是提升写入性能的关键，推荐选择IOPS≥10万、吞吐量≥500MB/s的NVMe SSD，比SATA SSD性能高2-3倍。
数据校验：导入完成后通过CRC32校验数据一致性：
- 计算文件CRC32值并存储
- 对数据库数据按批次计算CRC32，与文件值对比，定位丢失/错误数据
业务降级：导入期间建议关闭非核心查询业务，或通过读写分离将查询流量引导到从库，避免写入与查询竞争资源。

五、总结：分场景最佳实践

根据业务规模与可靠性要求，可选择不同的实施方案：

场景	推荐方案	优势	耗时参考
中小规模（1亿以内）	LOAD DATA INFILE + 单库分表	配置简单，无需分布式架构	1-2小时
大规模（1-10亿）	MyBatis Batch + 10库100表 + SSD	平衡性能与复杂度	5-10小时
超大规模（10亿以上）	Spark + 分库分表 + binlog同步	支持分布式并行处理	2-5小时
非核心业务	MyISAM引擎 + 批量插入	写入性能最高，配置简单	3-6小时