cassandra的设计思考

最新推荐文章于 2023-06-19 22:45:45 发布

lwl_ls

最新推荐文章于 2023-06-19 22:45:45 发布

阅读量757

点赞数

分类专栏：技术文章标签： cassandra immutable access application 存储 basic

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/lwl_ls/article/details/5616974

版权

技术专栏收录该内容

29 篇文章 0 订阅

订阅专栏

timestamp must be consistent across the application otherwise earlier changes may overwrite newer ones.

--------

Column is immutable, which prevents all kinds of confusion in a multithreaded environment.

-----------

为何设计column family?

与现实应用的分类相呼应，方便管理数据。

[bigtable:

column families, which form the basic unit of access control.

All data stored in a column family is usually of the same type (we
compress data in the same column family together). 压缩数据以减少磁盘io时间。

Access control and both disk and memory accounting are performed at the column-family level.

]

-----------

column family和row对应(可以多对一)，根据row的key属性排序

Related columns, those that you'll access together, should be kept within the same column family.

similar to the way you create tables in an RDBMS

------------------------

A row in a regular column family is basically a sorted map of column names to column values;(已排序的)

为何要有row的概念?

key/value中：key即为row中的key，value即为row的value。Row的value可以包含多个ColumnFamily

bigtable基于row的key排序

-----------

通常一个keyspace存储一个应用的数据。

For each keyspace there are one or more column families.

similar to how you create databases on an RDBMS server

-----------------

Cassandra不像数据库，不能在查询的时候指定排序规则，排序在数据存入时便完成了，并且始终保持在这个已排序的状态。

-------------

因为SSTable数据不可更新，可能导致同一个Column Family的数据存储在多个SSTable中，

这时查询数据时，需要去合并读取Column Family所有的SSTable和Memtable，这样到一个Column Family的数量很大的时候，

可能导致查询效率严重下降。因此需要有一种机制能快速定位查询的Key落在哪些SSTable中，而不需要去读取合并所有的SSTable。

Cassandra采用的是Bloom Filter算法，通过多个hash函数将key映射到一个位图中，来快速判断这个key属于哪个SSTable。

根据SSTableWriter.java看，一个SSTableWriter一个BloomFilter

每个SSTable都有一个BloomFilter，记录哪些key存在了这个SSTable中

-----------------

何时用:

Twitter 和 Digg 对数据存储引擎的需求相当独特： 写操作密集，基本无修改需求，读操作则多数是分散多次读取汇总展示

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

lwl_ls CSDN认证博客专家 CSDN认证企业博客

码龄19年

155: 原创

18万+: 周排名

37万+: 总排名

53万+: 访问

: 等级

7289: 积分

38: 粉丝

24: 获赞

61: 评论

57: 收藏

私信

关注

热门文章

分类专栏

algorithms(integration) 2篇
algorithms(technology) 34篇
books 2篇
books
C/C++ 22篇
diary
football vs foosball 1篇
heroes 4篇
java 12篇
OC 10篇
life 3篇
news
技术 29篇
song 1篇
朋友一生一起走 3篇
通讯 3篇

最新评论

Python、Unicode和中文
Tisfy: 十分完美，正如：弟妹萧条各何在，干戈衰谢两相催！
Python、Unicode和中文
--天天向上--: 亲测，windows下，将含有中文的py文件（行首没有声明编码类型）另存为utf-8格式，python命令执行后正常输出中文，没有报“Non-ASCII character”的错，楼主的错应该是自身windows导致的吧
fabric使用小结
lwl_ls 回复 Pluto19: 和证书无关，但是dsym要对应别传错
fabric使用小结
lwl_ls 回复 Pluto19: 手动上传有时要比较久，可能几分钟甚至十几二十分钟，但是最后都能上传成功。上传后，需要一段时间后才能看到堆栈，有时需要等到第二天。
fabric使用小结
Pluto19: 您好，为什么我自动上传dsym的时候，出错，到网站手动上传的时候也不行，这跟用development 证书和 distribution证书有关吗

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。