10亿记录的分区讨论，高手进

最新推荐文章于 2025-09-26 22:23:10 发布

转载最新推荐文章于 2025-09-26 22:23:10 发布 · 124 阅读

·

0

·

CC 4.0 BY-SA版权

原文链接：http://www.cnblogs.com/drunkyong/archive/2012/05/22/2512796.html

本文探讨了处理大量数据（每日新增300万至500万条记录，总数据量近10亿）的问卷调查系统面临的挑战。重点讨论了SQL Server分区策略的应用及其在服务器性能上的局限性，并提出通过历史数据迁移、读写分离等方法来优化系统性能。

我们做的是一个问卷调查系统，每天新增的数据量在300万~500万（答卷表），总数据量已经接近10亿。

答卷表结构：

QID 问卷ID

JID 参与ID

TID 题目ID

AID 答案ID

已经用sql server针对QID做了分区，但是服务器还是有点扛不住。

因为数据经常需要做统计分析（统计每个选项被选择了多少次），同时又会被不断的写入。

所以考虑将历史数据转移到另一个服务器上。

暂定的方案是每天晚上执行作业，将3个月以前的记录移动到历史库里面。（历史库基本上用于统计分析）

后续会考虑用sql server 发布与订阅的方式来进行读写分离。

不知道大家有没有更好的方案？

转载于:https://www.cnblogs.com/drunkyong/archive/2012/05/22/2512796.html

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。