- 博客(4)
- 收藏
- 关注
原创 cassandra表重命名方案
cql3.0中并没有给出重命名表的方式,所以需要从cassandra启动读取数据库文件、快照备份和还原的原理来入手 cassandra启动时会加载system_schema中的表的元信息然后根据这些元信息去定位数据文件位置 而cassandra快照的原理又是如下 1.将原有表目录下的文件做硬链接至./snapshots/目录下(元信息等一些比较小的文件采用直接写入的方式,
2017-04-11 16:53:31 2067
原创 Cassandra数据库设计与维护总结
1.分区字段设计时选用timeuuid/timestamp(比如每日或者每小时0点时间戳)+任意bucket字段(类型等固定的字段) 2.cluster字段可以根据需求设计 3.使用索引时的查询条件中务必带上分区字段的查询条件,否则cassandra会去所有分区字段的索引中查询,效率低下而且一旦查询结果中超过10万个墓碑,就会抛出异常 4.高基数字段比如true/false这类的
2017-04-02 15:55:39 763
原创 spark1.6使用过程中遇到的坑
1.streaming启动后卡死问题 产生这个问题的原因可能有两个,spark.cores.max spark.cores.max不能小于2的原因是streaming在启动时会提交一个用于接收数据的receiver,本质上是一个永远不会结束的job,会永久的占用一个executor core,如果core只有1,spark streaming将无法提交后续任务,spark.co
2017-01-18 11:04:26 1418
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人