![](https://img-blog.csdnimg.cn/20201014180756928.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
大数据
文章平均质量分 84
Angelahhj
这个作者很懒,什么都没留下…
展开
-
大数据十大经典算法之EM算法
在统计计算中,最大期望(EM)算法是在概率(probabilistic)模型中寻找参数最大似然估计或者最大后验估计的算法,其中概率模型依赖于无法观测的隐藏变量(LatentVariable)。最大期望经常用在机器学习和计算机视觉的数据聚类(DataClustering)领域。最大期望算法经过两个步骤交替进行计算,第一步是计算期望(E),利用对隐藏变量的现有估计值,计算其最大似然估计值;第二步是最大转载 2014-11-12 09:46:00 · 3340 阅读 · 0 评论 -
大数据十大经典算法之Aprior算法
数据集描述本文采用mushroom 数据集,该数据集由Jeff Schlimmer在1987年贡献,通常用于分类算法中。mushroom数据集包含8124个数据项。数据如下: 数据预处理过程在数据分析过程中,获得进行统计分析和建模的对象(即数据)的过程也是必不可少的重要环节。数据的预处理包括数据整理、数据合并及分拆、数据清洗、数据变换等内容。本文采用的数据预处理方法原创 2014-10-27 17:06:12 · 3973 阅读 · 2 评论 -
大数据十大经典算法之KNN
KNN算法简介KNN决策过程KNN缺点KNN适用范围KNN实例原创 2014-10-26 18:24:44 · 4603 阅读 · 0 评论 -
大数据十大经典算法之SVM
SVM 原理:传统的统计模式识别方法只有在样本趋于无穷大时,其性能才有理论的保证。而统计学习理论(STL)研究有限样本情况下的机器学习问题。SVM的理论基础就是统计学习理论。SVM使用一种非线性映射,把原训练数据映射到较高的维。在新的维上,搜索最佳分离超平面,两个类的数据总可以被超平面分开。SVM是一种有坚实理论基础的小样本学习方法。它基本上不涉及概论测度及大数定律等。 问原创 2014-11-04 20:54:16 · 5217 阅读 · 0 评论 -
大数据十大经典算法之k-means
kjK均值算法是基于质心的技术。它以K为输入参数,把n个对象集合分为k个簇,使得簇内的相似度高,簇间的相似度低。处理流程:1、为每个聚类确定一个初始聚类中心,这样就有k个初始聚类中心;2、将样本按照最小距离原则分配到最邻近聚类3、使用每个聚类中的样本均值作为新的聚类中心4、重复步骤2直到聚类中心不再变化5、结束,得到K个聚类划分聚类方法对数据集进行聚类时的要点1原创 2014-11-04 17:20:46 · 4135 阅读 · 0 评论 -
大数据十大经典算法
国际权威的学术组织the IEEE International Conference on Data Mining (ICDM) 2006年12月评选出了数据挖掘领域的十大经典算法:C4.5, k-Means, SVM, Apriori, EM, PageRank, AdaBoost, kNN, Naive Bayes, and CART. 不仅仅是选中的十大算法,其实参加评选的18种算法转载 2014-11-06 11:17:37 · 10244 阅读 · 0 评论