机器学习
文章平均质量分 74
huipingx
这个作者很懒,什么都没留下…
展开
-
机器学习基础知识点归纳
一.生成模型与判别模型1.概念介绍参考:https://blog.csdn.net/u012101561/article/details/52814571参考:http://www.cnblogs.com/fanyabo/p/4067295.html监督学习的任务是学习一个模型,对给定的输入预测相应的输出,监督学习模型可分为生成模型与判别模型。直观来说,生成模型学习的是联合概率分布P(X...原创 2018-12-15 18:08:04 · 906 阅读 · 0 评论 -
聚类
1.KMeans聚类选择想要聚成多少组。随机初始化中心点,计算该点与每个组中心之间的距离,然后将该点分类为其中心最接近它的组,对每个数据点进行分类。基于这些分类点,我们通过取组中所有向量的均值来重新计算组中心。重复这些步骤进行一定数量的迭代,直到组中心在迭代之间没有太大变化。KMeans的优势在于它非常快,因为我们所做的只是计算点和组中心之间的距离。另一方面,KMeans有几个缺点。首先,必须...原创 2018-12-15 21:35:57 · 584 阅读 · 0 评论 -
机器学习评价指标(ACC,P,R,F1,AUC等)
分类TP:正例预测正确的个数FP:负例预测错误的个数TN:负例预测正确的个数FN:正例预测错误的个数准确率(accuracy)精确率(precision) 描述的是在所有预测出来的正例中有多少是真的正例准确率与精确率的区别:在正负样本不平衡的情况下,准确率这个评价指标有很大的缺陷。比如在互联网广告里面,点击的数量是很少的,一般只有千分之几,如果用acc,即使全部预测成负类(不点...原创 2018-12-15 22:24:01 · 40723 阅读 · 6 评论 -
机器学习算法总结
一.逻辑回归逻辑回归假设数据服从伯努利分布,通过极大化似然函数的方法,运用梯度下降来求解参数,来达到将数据二分类的目的。似然函数对数似然函数损失函数通过极大似然取反可以得到损失函数求解极大似然可得估计,梯度求解法优点实现简单 容易理解计算代价不高 速度快可得到样本概率函数缺点不能拟合非线性数据对多重共线性比较敏感二.支持向量机支持向量机特点:间隔最大,核函数...原创 2018-12-16 13:32:02 · 152 阅读 · 0 评论 -
机器学习集成算法总结
一.Voting思想:选取多个分类器,少数服从多数二.Bagging特点: 放回抽样方法:1.放回抽样训练集2.Outofbagging:放回抽样中总有一部分数据没被抽到,可将这部分作为验证集3.随机采样特征4.随机采样特征+随机采样训练集,如随机森林随机森林优点可处理高位数据且不用做特征选择能够计算特征重要性泛化能力好训练速度快缺点在某些噪音较大的问题上容易过拟合...原创 2018-12-16 14:27:36 · 172 阅读 · 0 评论 -
一些算法讲解比较好的链接
wmd文档相似度:http://www.omegaxyz.com/2018/11/22/wmd/社区发现Fast Unfolding算法:https://blog.csdn.net/google19890102/article/details/48660239社区发现算法总结:https://www.cnblogs.com/nolonely/p/6262508.htmlPersonalRan...原创 2019-03-24 22:21:41 · 351 阅读 · 0 评论