2017年06月_stevekangpei

09月 08月 07月 06月

原创 Spark MLlib源代码解读之朴素贝叶斯分类器，NaiveBayes

Spark MLlib 朴素贝叶斯NaiveBayes 源代码分析基本原理介绍首先是基本的条件概率求解的公式。P(A|B)=P(AB)P(B)P\left ( A|B \right )=\frac{P(AB)}{P(B)}在现实生活中，我们经常会碰到已知一个条件概率，求得两个时间交换后的概率的问题。也就是在已知P(A|B)的情况下，如何求得P(B|A). 其中P(A|B)表示在事件B发生的前提下，

2017-06-22 21:41:06 3477 3

原创 Spark MLlib Kmeans源代码解读(上)

Spark MLlib 源代码解读之Kmeans(上)PS:第一次写博客，希望大家支持，谢谢。基本原理：Kmeans算法的基本思想是：初始随机给定k个簇中心，按照最近邻的点将数据集中所包含的点分给不同的中心点，进而得到数据的分类。在分类过程中，需要不停的进行迭代，同时更新中心点的坐标，直到中心点的移动距离小于某一个给定的精度值。Kmeans的聚类算法主要分为以下三个步骤：如下图所示我们可以看到，

2017-06-17 15:30:28 4704

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人