机器学习
探索者v
这个作者很懒,什么都没留下…
展开
-
防止过拟合以及解决过拟合
过拟合为了得到一致假设而使假设变得过度复杂称为过拟合。 “一个过配的模型试图连误差(噪音)都去解释(而实际上噪音又是不需要解释的),导致泛化能力比较差,显然就过犹不及了。” 这句话很好的诠释了过拟合产生的原因,但我认为这只是一部分原因,另一个原因是模型本身并不能很好地解释(匹配)数据,也就是说观测到的数据并不是由该模型产生的。“统计学家说:我们让数据自己说话。言下之意就是要摒弃先验概率。而贝叶转载 2016-03-03 11:16:44 · 7354 阅读 · 1 评论 -
标准差(Standard Deviation) 和 标准误差(Standard Error)
本文摘自Streiner DL.Maintaining standards: differences between the standard deviation and standarderror, and when to use each. Can J Psychiatry 1996; 41: 498–502.http://www.07net01.com/program/306401.html标转载 2016-03-08 21:57:58 · 88477 阅读 · 2 评论 -
PLSDA 构建 ROC曲线
plsda的计算使用R语言caret包中的plsda函数, 对数据进行pls后将回归预测值进行比较得到结果.PLSDA判别后会有两列(列数等于分类数),常规计算没有使用贝叶斯 第一列的概率使用: exp(col1_value)/(exp(col1_value)+ exp(col2_value)) 第二列的概率使用: exp(col2_value)/(exp(col1_value)+ exp原创 2016-02-29 23:26:35 · 9409 阅读 · 0 评论 -
R语言手动计算主成分分析(PCA)及其在R函数的实现
R语言手动计算主成分分析(PCA)及其在R函数的实现了解PCA的原理,但总是无法用R语言实现,这次算是有个教程。 转自:http://blog.163.com/xiaoji0106@126/blog/static/13613466120133185842687/ 主成分分析(principal component analysis,PCA)是一种降维技术,把多个变量化为能够反映原始变转载 2016-05-04 00:38:29 · 25178 阅读 · 0 评论 -
层次聚类算法的原理及实现Hierarchical Clustering
层次聚类(HIERARCHICAL CLUSTERING)是聚类算法的一种,通过计算不同类别数据点间的相似度来创建一棵有层次的嵌套聚类树。在聚类树中,不同类别的原始数据点是树的最低层,树的顶层是一个聚类的根节点。创建聚类树有自下而上合并和自上而下分裂两种方法,本篇文章介绍合并方法。转载 2017-12-06 15:45:49 · 4075 阅读 · 0 评论 -
【机器学习】分类性能度量指标 : ROC曲线、AUC值、正确率、召回率、敏感度、特异度
本文转自 http://zhwhong.ml/2017/04/14/ROC-AUC-Precision-Recall-analysis/在分类任务中,人们总是喜欢基于错误率来衡量分类器任务的成功程度。错误率指的是在所有测试样例中错分的样例比例。实际上,这样的度量错误掩盖了样例如何被分错的事实。在机器学习中,有一个普遍适用的称为混淆矩阵(confusion matrix)的工具,它可以帮助人们更转载 2018-01-19 17:43:35 · 73648 阅读 · 10 评论 -
【机器学习】图解机器学习十大算法
本文转自 https://mp.weixin.qq.com/s?__biz=MzA3MTIyNzIxOQ==&mid=2655533205&idx=4&sn=1f9d286c2f4874dc97d9e1ee6759d720&chksm=848c5aa9b3fbd3bfa55d5ce1b8e667e96458067be5b1d4ebc8964bf14c9cf249046ba1830e80&mpsha转载 2018-01-19 18:49:32 · 908 阅读 · 0 评论