- 博客(3)
- 资源 (5)
- 收藏
- 关注
转载 hbase高性能读取数据
有时需要从hbase中一次读取大量的数据,同时对实时性有较高的要求。可以从两方面进行考虑:1、hbase提供的get方法提供了批量获取数据方法,通过组装一个list gets即可实现;2、java多线程的Future方法实现了如何从多线程中获取返回数据。以上两种方法结合后,获取数据将会更加的高效。阅读到一篇文章,对这两个方法的结合使用给出了实例,并有详细的性能分析。特意转载过来,供以后的参考学习:
2016-01-09 11:51:02 24047 1
原创 2015年总结
时光如梭,稍不留神,就又到年底了。每至此时,都不免有些感慨,除了脸上增加的皱纹,岁月还带给了我一些什么呢?2015年,可谓平静又有波澜。辞掉了一份平静如水的工作,踏上了快节奏的工作路途。毕业至此2年有余,一至在想自己到底需要什么样的生活、适合什么样的工作,在平静安逸的工作中挣扎、纠结每天的无所事事的状态,自己并不喜欢。心理学上说:人要取得进步,就必须不断突破自己的心理舒适区,进入不适应状态,不
2016-01-09 11:24:24 792
翻译 K均值聚类的失效性分析
K均值聚类是一种应用广泛的聚类技术,特别是它不依赖于任何对数据所做的假设,比如说,给定一个数据集合及对应的类数目,就可以运用K均值方法,通过最小化均方误差,来进行聚类分析。因此,K均值实际上是一个最优化问题。在一些已知的文献中论述了K均值聚类的一下一些缺点:K均值假设每个变量的分布是球形的;所有的变量具有相同的方差;类具有相同的先验概率,要求每个类拥有相同数量的观测;上述三条任何一
2016-01-02 11:28:43 5408
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人