- 博客(4)
- 资源 (4)
- 收藏
- 关注
原创 spark mllib java.lang.UnsatisfiedLinkError: org.jblas.NativeBlas.dposv解决办法
Spark documentation clearly mentions that MLLib uses native libraries, which need to be present on the nodes.for debian/ubuntu use: sudo apt-get install jblas libgfortran3
2015-01-28 22:34:45 686
转载 KMeans on Spark
转载自: http://blog.csdn.net/li385805776/article/details/20041179思路:1.随机生成数据2.随机生成K个聚类中心3.计算每个点所属的类别4.计算新的聚类中心5.比较聚类中心的变化情况,大于阈值跳转至3;小于阈值停止。package myclassimport java.u
2015-01-28 15:59:47 514
原创 Manage ZooKeeper in IntelliJ IDEA
Manage ZooKeeper in IntelliJ IDEA.After install ZooKeeper plugin, please open "Preferences" to set connection information in "ZooKeeper" item, then you willfind a "ZooKeeper" tool windown, click "
2015-01-24 21:50:54 2020
转载 Hbase -- 表的设计
1. 表的设计1.1 Pre-Creating Regions默认情况下,在创建HBase表的时候会自动创建一个region分区,当导入数据的时候,所有的HBase客户端都向这一个region写数据,直到这个region足够大了才进行切分。一种可以加快批量写入速度的方法是通过预先创建一些空的regions,这样当数据写入HBase时,会按照region分区情况,在集群内做数据的负载均衡
2015-01-24 21:38:46 290
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人