1. 与列族数据库相关的设计要点
- 列族数据库应该事先成稀疏且多维的 map
- 在列族数据库中,各个数据行所拥有的列是可以有所不同的
- 列族数据库的列是可以动态添加的
- 列族数据库不需要执行连接操作,需要对数据模型去规范化处理
2. 设计数据表格时需遵循的建议
- 用去规范化来代替连接
- 善用无值的列
- 同时在列名和列值之中存储数据
- 用一个数据行来为一个实体建模
- 设计行键时不要讲大量操作分配给少数服务器
- 维护适当数量的列值版本
- 不要在列值中使用复杂的数据结构
3. 使用列族数据库时怎样才能避免执行连接操作?
在列族数据库中,多对多的关系是通过去规范化的数据模型来表示的。
4. 为什么说实体应该建模成一个单独的数据行?
实体可以表示具体的事物,也可以表示成抽象的概念。列族数据库用数据行来对实体进行建模。
一个数据行应该对应于一个实体。数据行之间通过 row key 来区分身份。
而且列族数据库不需要执行连接操作,需要对数据模型去规范化处理。
列族数据库并不提供与关系数据库级别相同的事务控制机制。
一般来说,对数据行的写入是原子操作。若更新表格中的多个列,则这些列全部得到更新,要么一个也无法更新。
5. 什么叫做热点现象(hotspotting), 为什么应该避免这种现象?
分布式系统可以使我们利用许多台服务器来解决问题,但如果把大量的任务都压在了少数几台服务器上,就会令
分布式系统中产生热点(hotspotting),这样就会导致