- 博客(2)
- 收藏
- 关注
原创 Machine Learning on Spark -- Basic Statistics
1.Summary statistics 统计量我是一颗文艺草,欢迎关注小草-墨色凤舞的微信号,带我飞~colStats提供了针对向量形式RDD 的列的统计量。colStats() 返回了一个MultivariateStatisticalSummary的实例, which contains the column-wise max, min, mean, variance, and number of
2016-02-29 16:45:39 969
原创 Machine Learning on Spark--Data Type
1. Local vector 本地向量本地向量拥有长整型的integer-based,基于0指标的0-based,双精度double的值,存储在一台单独的本地机器上。MLlib支持两种类型的局部变量:稠密的dense和稀疏的sparse。1.1 dense vector稠密向量稠密向量是由双精度的数组支持,比如,(1.0,0.0,3.0),稠密向量显示为[1.0,0.0,3.0]//导入向量包i
2016-02-29 15:04:32 1211 1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人