机器学习
文章平均质量分 79
qq_23617681
这个作者很懒,什么都没留下…
展开
-
k-means聚类算法python实践
k-means是机器学习中聚类算法的一种,也是最容易理解的。算法思想:通过迭代,寻找K个聚类的划分方案。使得K个聚类的总体误差最小,其中误差用均值表示。算法步骤:1、根据用户给定的K值,随机选取K个聚类质心2、重复如下步骤直到收敛(即没有样本所属聚类发生变化)2.1、计算每个样本点的所属聚类2.2、统计聚类样本,更新每个聚类质心2.3、样本点所属原创 2016-03-30 13:51:35 · 2976 阅读 · 0 评论 -
python实践之:用朴素贝叶斯实现分类
第一部分:朴素贝叶斯理论介绍公式如下:其中:p(A)、 P(B)称为先验概率,P(A|B)、 P(B|A)称为后验概率、条件概率。贝叶斯理论描述这样一件事情:当我们知道历史数据,即等式右边,就可以预测未来,等式左边。虽然预测是有一定概率的,但它仍然给我们预测未来一个可以参考的数据,即概率。再通俗一点,上述公式表述为:通过历史数据知道A的先验概率,以及B的后验概率时,原创 2016-03-31 15:53:14 · 6385 阅读 · 2 评论 -
机器学习基础知识、与图像处理等技术的关系
在36氪上看到一篇很好的关于机器学习的文章,对机器学习与各个领域的结合讲得非常清晰。现小结一下如下。基本定义:机器学习方法是计算机利用已有的数据(经验),得出了某种模型(迟到的规律),并利用此模型预测未来(是否迟到)的一种方法。机器学习与人类对历史经验的归纳,类比图如下:机器学习的范畴,见下图:下面逐个介绍机器学习与各领域之间的关系。原创 2016-04-15 13:57:01 · 7380 阅读 · 2 评论 -
随机森林、EM、HMM、LDA
本篇简单介绍这些概念。随机森林(Random Forest)是一种分类和回归算法,它包含了多个决策树,形成一个森林,随机森林的类别是所有决策树分类回归结果的众数决定。由于它优点很多,适应比较广泛.1、能够处理高维数据,不用做特征选择,自动选出那些特征重要。2、训练速度快,分类精度高。3、能检测到特征之间的相互影响。4、不会产生过拟合。期望最大化(Expe原创 2016-05-23 16:55:07 · 2185 阅读 · 1 评论