机器学习
lianchaozhao
这个作者很懒,什么都没留下…
展开
-
spark kmean学习 demo
1、kmean 背景 Spark的MLlib库提供了许多可用的聚类方法的实现,如 KMeans、高斯混合模型、Power Iteration Clustering(PIC)、隐狄利克雷分布(LDA) 以及 KMeans 方法的变种 二分KMeans(Bisecting KMeans) 和 流式KMeans(Streaming KMeans)等。 ...原创 2019-07-08 16:41:05 · 271 阅读 · 0 评论 -
spark LDA主题模型
LDA是一个三层贝叶斯概率模型,包含词、主题和文档三层结构。 LDA可以用来生成一篇文档,生成时,每个词都是通过“以一定概率选择了某个主题,并从这个主题中以一定概率选择某个词语”,这样反复进行,就可以生成一篇文档;反过来,LDA又是一种非监督机器学习技术,可以识别出大规模文档集或语料库中的主题。 参考:http://bigdata-star.com/archives/1863 ...原创 2019-07-10 13:45:20 · 387 阅读 · 0 评论