zzxzz00001-CSDN博客

原创 cassandra表重命名方案

cql3.0中并没有给出重命名表的方式，所以需要从cassandra启动读取数据库文件、快照备份和还原的原理来入手cassandra启动时会加载system_schema中的表的元信息然后根据这些元信息去定位数据文件位置而cassandra快照的原理又是如下1.将原有表目录下的文件做硬链接至./snapshots/目录下（元信息等一些比较小的文件采用直接写入的方式，

2017-04-11 16:53:31 2187

原创 Cassandra数据库设计与维护总结

1.分区字段设计时选用timeuuid/timestamp(比如每日或者每小时0点时间戳)+任意bucket字段(类型等固定的字段)2.cluster字段可以根据需求设计3.使用索引时的查询条件中务必带上分区字段的查询条件，否则cassandra会去所有分区字段的索引中查询，效率低下而且一旦查询结果中超过10万个墓碑，就会抛出异常4.高基数字段比如true/false这类的

2017-04-02 15:55:39 889

原创 spark1.6使用过程中遇到的坑

1.streaming启动后卡死问题产生这个问题的原因可能有两个,spark.cores.max spark.cores.max不能小于2的原因是streaming在启动时会提交一个用于接收数据的receiver,本质上是一个永远不会结束的job,会永久的占用一个executor core,如果core只有1，spark streaming将无法提交后续任务,spark.co

2017-01-18 11:04:26 1543

原创 Storm优化心得

storm的一些个人调优经验

2016-05-24 19:18:36 2158

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人