高并发和大数据的一些小trick

最新推荐文章于 2022-07-09 14:12:54 发布

jhgdike

最新推荐文章于 2022-07-09 14:12:54 发布

阅读量343

点赞数

分类专栏：备忘

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/jhgdike/article/details/79200443

版权

备忘专栏收录该内容

15 篇文章 0 订阅

订阅专栏

之前看书或者浏览博客中遇到过的一些有趣的题，记录下来。

在阅读《MySQL高性能》这本书索引部分的时候，看到其中某一段描述，大意是：

在数据量大的情况下，可以对某个键做hash，求出hashcode，然后对hashcode做索引。数据量大了，直接用B+树索引的话，搜索会变的很慢，比如说数据量上亿条，B+索引就会很慢；而如果换一种思路，不直接对之间的key字段建立索引，而是根据某种规则，让对key进行hash后的code有一定几率重复，然后对这个hashcode建立索引，那么就会一定程度上提高MySQL的查询速度，虽然这回占用额外的空间。
因为innodb引擎的索引是B+树数据结构，所以对于这种有重复key的数据，就会有比较好的查询效率支持。

想到的另外一个解决方案：
可以根据hashcode的大小范围，存进多个表里面，比如说1亿条数据，那么我建立100个表，这样每个表里面大约会保存100w条数据，规模降到了100w级，那么查询效率就会高很多。

类似的一个问题：

在Go中map是非并发安全的，那么如果有一种场景下，我们只能有一个map，但map里面存了上百万条数据，测试显示，当map里面的数达到10w级别的时候就会触发并发安全问题，那么这个时候又该怎么办呢？

类似的，我们可以在一个map里面村上成百上千个二级map，每个二级map里面存真实的数据。这样我们只要建立一套hash规则，对于某个范围的hashcode，存放到相应的二级map里面就可以了。分而治之的思想。

同样的思路还有，当并发达到一定程度之后，就需要添加多台服务器以提高吞吐，10台机器不够我们可以加到100台。

像这类小trick还是有必要记录下来的，遇到相关场景会有关键作用。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

jhgdike CSDN认证博客专家 CSDN认证企业博客

码龄12年

36: 原创

18万+: 周排名

44万+: 总排名

12万+: 访问

: 等级

1373: 积分

70: 粉丝

33: 获赞

15: 评论

55: 收藏

私信

关注

热门文章

分类专栏

环境集成 1篇
备忘 15篇
算法基础 2篇
Java 1篇
Git使用 2篇
后台开发 4篇
javascript 2篇
python 16篇
个人日记 5篇
MySQL 7篇
linux 2篇
Go 2篇

最新评论

MySQL insert 死锁问题记录
CSDN-Ada助手: MySQL入门技能树或许可以帮到你：https://edu.csdn.net/skill/mysql?utm_source=AI_act_mysql
Mysql为什么不建议使用join
qq_255233: 首先，感谢分享。全网都在说不使用join的好处，难道全部都是好处吗？我还想说，你是在怀疑百度搜索引擎的能力吗？完全一致的文章出现多次有意义吗？
MySQL表为什么必须有主键 -- 聚集索引的简单介绍
ccubee: 学习了感谢分享
Go踩坑之 time.Parse: month out of range
洪爷爷: time.Parse("2016-12-25 00:00:00", timeStr) 改成 time.Parse("20060102", "20180128") 或者 time.Parse("2006-01-02", "2018-01-28") 都是可以的，你记错go的日期标识符了，所以错的
前台 post方法提交却变成了 get 方法
sparks5: 感谢lz！！

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。