大数据算法
文章平均质量分 78
威廉的大数据实验室
这个作者很懒,什么都没留下…
展开
-
朴素贝叶斯分类算法的R语言实现
贝叶斯分类常用来预测隶属关系,计算一个给定元组属于某一类的概率首先我们来看下贝叶斯基本公式:P(B|A)的意思是在A事件的情况下,发生B事件的概率,可以理解为概率论中的条件概率,而贝叶斯公式的巨大作用就是对因果关系进行了交换,通过上面的公式就可以计算P(A|B)的概率,只要通过上述的转换。朴素贝叶斯分类的正式定义如下:原创 2015-03-07 13:18:18 · 8877 阅读 · 0 评论 -
CRISP-DM (cross-industry standard process for data mining) 跨行业数据挖掘标准流程
CRISP-DM (cross-industry standard process for data mining), 即为"跨行业数据挖掘标准流程". 此KDD过程模型于1999年欧盟机构联合起草. 通过近几年的发展,CRISP-DM 模型在各种KDD过程模型中占据领先位置,采用量达到近60%.(数据引自Cios and Kurgan于2005年合著的论文trands in data min转载 2015-03-01 22:32:50 · 1918 阅读 · 0 评论 -
Facebook好友分布规律R语言分析
社交网络 R语言原创 2015-03-22 09:47:15 · 2553 阅读 · 1 评论 -
KNN算法及R语言实现
KNN(k-Nearest Neighbor)分类算法是数据挖掘分类技术中较简单的方法之一。所谓k最近邻,就是k个最近的邻居的意思,说的是每个样本都可以用它最接近的k个邻居来代表。 例如,上图中,绿色圆要被决定赋予哪个类,是红色三角形还是蓝色四方形?如果K=3,由于红色三角形所占比例为2/3,绿色圆将被赋予红色三角形那个类,如果K=5,由于蓝色四方形比例为3/5,因此绿色原创 2015-03-08 22:27:34 · 46490 阅读 · 1 评论 -
PageRank算法解析及R语言实现
在PageRank算法出现之前,早期的搜索引擎是根据关键词出现次数对网页进行排序,但这样的算法有严重的缺陷...原创 2015-03-12 00:12:35 · 5624 阅读 · 0 评论