- 博客(2)
- 收藏
- 关注
原创 hive metastore
1. 概述通过hive metastore能访问hive的元数据,hive的元数据使用Data Nucleus持久化,因此mysql等数据库可以和hive结合,存储元数据。2. metastore的两种方式配置metastore服务端以及metastore数据库主要有内嵌、远程两种方式。2.1 内嵌方式hive使用derby作为内嵌的metastore数据库,主要用于测试,但是在同一时间,它只允许...
2018-06-30 21:48:29 981
原创 sgd kmeans
Kmeans算法一般采用两个步骤: 1、遍历每条样本,确定距离最近的中心点为其中心; 2、针对新的每条样本分布重新确定新的中心。重复步骤,直至各样本的中心点不再改变。 由于每次迭代需要所有样本,将其结合随机梯度下降算法,将提高收敛速度。主要见文献[1]。采用如下算法: 经过代码验证,采用iris dataset,有如下效果(效果受初始值影响): 图1为原始分类,图2为...
2018-06-23 22:02:07 840 2
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人