对索引存储与散列存储的一些形而上的思考

一方架构

于 2019-12-26 15:13:20 发布

阅读量551

点赞数 2

分类专栏：阅读

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/pengych_321/article/details/103715957

版权

阅读专栏收录该内容

17 篇文章 0 订阅

订阅专栏

场景

对于大表，为了加速期查询速度，往往在外键上加索引、Java集合类中HashMap使用的很频繁等等，而对于索引存储与散列存储的理解一直不清晰。

问题

索引存储与散列存储怎么理解

分析

房间比作存储单元，房间号比作存储单元地址。问题来了，如何快速在一家酒店找到自己的灵魂伴侣呢？这里先假设她（或者他）肯定在某一房间内，身份证作为关键字，你只知道她的身份证号码，长啥样你不知道。首先，数据的存储方式决定其查找方式：

顺序存储
你就只能拿着身份证号码一层一层一间房一间房去找了：费劲啊，时间复杂度n/2；这里应该还涉及到数据安全问题:你不一定又钥匙，她也不一定相信你，让你比对身份证号码。
链式存储
相对顺序存储，链式存储对存储空间的物理位置没有要求:假设酒店有10间房子，顺序存储要求10间房子物理位置相邻，而后者10间房可以分散在不同层且不相邻。查找时间复杂度:n/2―还是得拿着身份证挨房去查找。
索引存储
存的时候比较费劲，除了存储节点本身信息外还得花费额外空间建立，存储并维护索引表（个人理解，索引存储应该属于顺序存储与链式存储的一种：节点位置要么相邻要么不相邻）。这时只要根据灵魂伴侣的身份证号码，查表（怎么查呢，得看怎么存储，递归），就可以知道她在那间房了，狠开心。时间复杂度：常量级。空间复杂度：比顺序链式要高。
散列存储
根据身份证通过散列函数直接算（而不是查表）出她的房间号。时间复杂读：常量级。其他（待了解）：由于用到散列函数，需要额外计算单元支持。

总结

散列或者索引存储是为了提高查询效率，而在存储数据的时候，除了节点实际数据，还存储了其他提高查询数据效率的因子（表，计算单元，或者其他）

写于 2016年2月

关注

2
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

一方架构 CSDN认证博客专家 CSDN认证企业博客

码龄13年

100: 原创

7万+: 周排名

117万+: 总排名

31万+: 访问

: 等级

3812: 积分

182: 粉丝

75: 获赞

68: 评论

175: 收藏

私信

关注

热门文章

分类专栏

软考
投资 4篇
开发 58篇
阅读 17篇

最新评论

读《王垠：当然我在扯淡》
SeaflyWechat: 不知道为啥，阅读他的文章，给我一种这样的感觉，就是你也可以像他一样，静静地站在某处安静的山顶上，看着山下世间百态的那种脱俗感。给人一种心灵洗涤的感觉，看完之后，能感觉我目标明确了，意识更清晰了。
[1.3]Spark core编程（二）之RDD执行流程图与RDD的基本操作
weixin_42556385: 图一没有体现出数据分区的概念，至少要画多个excutor才能叫分布式吧
祝你生日快来
一方架构: 加油，营琪兄
如何在简历中编写Spark大数据项目经验
f27eggg: 一个hd生态体系就喝一壶了，写的真自信，拿这套面过大厂吗就发出来了。
祝你生日快来
营琪: 我是23岁生日当天开始大数据实习，就如大佬说的，大数据三步骤：1.离线计算 2.实时计算 3.机器学习。我现在走到第二阶段了，但是基础不是很稳，前段时间焦虑了很久，看到大佬的随记，好像有点恍然大悟的感觉。感谢大佬。

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。