机器学习
baidu_252253
这个作者很懒,什么都没留下…
展开
-
Pytorch的使用(一)
https://blog.csdn.net/zzulp/article/details/80573331转载 2019-05-20 10:28:07 · 161 阅读 · 0 评论 -
机器学习——信息熵
信息熵(Entropy)信息是个很抽象的概念。我们常常说信息很多,或者信息较少,但却很难说清楚信息到底有多少。比如一本书中到底有多少信息量。直到 1948 年,香农(C. E. Shannon)提出了“信息熵”(shāng) 的概念,才解决了对信息的量化度量问题。熵的概念发展成为信息论、数据压缩等学科的基础,在很多科学研究的领域尤其是计算机科学中有着广泛的应用。实际上,一条信息的信息量大小...转载 2019-07-30 14:06:43 · 551 阅读 · 0 评论 -
训练集、验证集、测试集以及交验验证的理解
在人工智能机器学习中,很容易将“验证集”与“测试集”,“交叉验证”混淆。一、三者的区别训练集(train set) —— 用于模型拟合的数据样本。验证集(development set)—— 是模型训练过程中单独留出的样本集,它可以用于调整模型的超参数和用于对模型的能力进行初步评估。在神经网络中, 我们用验证数据集去寻找最优的网络深度(number o...转载 2019-07-29 16:52:07 · 3013 阅读 · 0 评论 -
提高机器学习模型性能的五个关键方法
https://blog.csdn.net/ebzxw/article/details/82528059转载 2019-07-09 09:52:58 · 248 阅读 · 0 评论 -
机器学习模型提高准确率的八大方法
想要提高模型的性能有时会是一件难度不小的事情。如果你也遇到过类似的情况,相信一定会认同我这一看法。在一一尝试毕生所学的对策和算法之后,依然没能够提高模型的准确率,这时,一种陷入困境的无助感就会涌上心头。事实上,百分之九十的数据科学家就是在这一阶段选择了放弃。但是,好戏这才开始!正是这一点划清了平凡的数据科学家与非凡的数据科学家的界限。你是不是也梦想着成为一名卓越的数据科学家呢?如果是的话,...转载 2019-07-08 14:25:42 · 14585 阅读 · 2 评论 -
机器学习:PR曲线、准确率(Precision)、召回率(Recall)、F值(F-Measure)、ROC曲线
增注:虽然当时看这篇文章的时候感觉很不错,但是还是写在前面,想要了解关于机器学习度量的几个尺度,建议大家直接看周志华老师的西瓜书的第2章:模型评估与选择,写的是真的很好!!以下第一部分内容转载自:机器学习算法中的准确率(Precision)、召回率(Recall)、F值(F-Measure)是怎么一回事摘要:数据挖掘、机器学习和推荐系统中的评测指标—准确率(Precision)、召回率...转载 2019-07-08 14:16:52 · 7308 阅读 · 0 评论 -
机器学习中的正确率、召回率
正确率:TP/(TP+FP),表示预测为正例的样本中真正正例的比例。召回率:TP/(TP+FN),表示预测为正例的真实正例占所有正例的比例。AUC = 1,是完美分类器,采用这个预测模型时,不管设定什么阈值都能得出完美预测。绝大多数预测的场合,不存在完美分类器。(https://blog.csdn.net/qq_23664173/article/details/83010348) 0...转载 2019-07-08 14:00:45 · 5755 阅读 · 0 评论 -
基尼不纯度(随机森林)
基尼不纯度:从一个数据集中随机选取子项,度量其被错误的划分到其他组里的概率。(书上解释)一个随机事件变成它的对立事件的概率(简单理解)计算公式:(fi为某概率事件发生的概率)下图是相关曲线图,可以参考数据挖掘导论的98页:从上图可以看出,基尼系数和熵之半的曲线非常接近,仅仅在45度角附近误差稍大。因此,基尼系数可以做为熵模型的一个近似替代。讲解案例:一个随...转载 2019-06-10 15:01:20 · 5678 阅读 · 1 评论 -
(随机森林)算法及实现
阅读目录1 什么是随机森林? 2 随机森林的特点 3 随机森林的相关基础知识 4 随机森林的生成 5 袋外错误率(oob error) 6 随机森林工作原理解释的一个简单例子 7 随机森林的Python实现 8 参考内容回到顶部1 什么是随机森林? 作为新兴起的、高度灵活的一种机器学习算法,随机森林(Random Forest,简称RF)拥有广泛的应用前景,从市场营销...转载 2019-05-22 17:54:12 · 2779 阅读 · 0 评论 -
机器学习入门(新手篇)
http://www.cnblogs.com/wkslearner/p/8933685.html(机器学习中特征的处理及选择)https://baijiahao.baidu.com/s?id=1593022777941849057&wfr=spider&for=pc(新手必看的十种机器学习算法)https://bbs.pinggu.org/thread-6289960-1-...转载 2019-05-22 17:50:35 · 171 阅读 · 0 评论 -
(原理)逻辑回归
https://blog.csdn.net/nageaixiaodenanhai/article/details/81592713https://www.cnblogs.com/nolonely/p/6435083.htmlhttps://www.cnblogs.com/zy230530/p/6875145.html转载 2019-05-22 13:39:57 · 98 阅读 · 0 评论 -
训练集和测试集的划分
https://testerhome.com/topics/13369https://www.jianshu.com/p/97656909da9b转载 2019-05-21 20:49:39 · 2046 阅读 · 0 评论 -
训练集和测试集的划分
上一个博客讲了一个简单的例子,根据手头的房子大小和房价的数据来拟合房子大小和房价的关系曲线,当然这是一个非常简单的一元一次方程,y=ax+b。但是最后咱们还少了一样东西,不知道细心的同学有没有发现,那就是咱们拟合曲线的准确度到底有多少呢?怎么来检测咱们拟合曲线到底有多完美呢?用什么来验证咱们的准确度呢? 带着一肚子疑问,咱们就先来介绍一下数据拟合中的训练集,测试集,验证集。字比较多,但都很...转载 2019-05-21 20:42:51 · 10058 阅读 · 0 评论 -
机器学习三要素之数据、模型、算法
https://blog.csdn.net/RedPintings/article/details/80705154注: 本系列 课程源于李烨 · (微软高级软件工程师)老师的文档 在gitbook 上可以买到李老师课程。机器学习三要素包括数据、模型、算法。简单来说,这三要素之间的关系,可以用下面这幅图来表示:总结成一句话:算法通过在数据上进行运算产生模型。下面我们先分别...转载 2019-05-11 18:05:03 · 823 阅读 · 0 评论 -
逻辑回归
https://blog.csdn.net/weixin_39910711/article/details/81607386(逻辑回归模型(Logistic Regression, LR))https://www.jianshu.com/p/e51e92a01a9c转载 2019-05-20 11:58:46 · 87 阅读 · 0 评论 -
TensorFlow的使用
https://blog.csdn.net/flysnowjava/article/details/80545774转载 2019-05-20 10:31:24 · 90 阅读 · 0 评论 -
随机森林学习整理(Bagging + 决策树 = 随机森林)
https://blog.csdn.net/fantacy10000/article/details/90695133转载 2019-07-30 17:50:17 · 428 阅读 · 0 评论