![](https://img-blog.csdnimg.cn/20201014180756925.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
机器学习
RNGXiaohua
比咸鱼还咸
展开
-
机器学习是做什么的
人类可以根据自己的经验对事情做出判断,比如根据天上的云判断是否要下雨,根据敲西瓜判断是否熟了;机器学习就是将这种行为赋予计算机,让计算机根据自己的“经验”给出判断结果;在计算机系统中,“经验”以“数据”的形式存在;机器学习的研究的主要内容:得到一种什么样的算法,进而让数据产生一个模型;有了算法,我们就可以将数据提供给它,它就能基于这些数据产生模型;机器学习就是一门研究“学习算法”的...原创 2019-09-22 12:38:26 · 884 阅读 · 0 评论 -
机器学习基本术语
特征(feature) 反映事件或者对象在某方面的表现或性质的事项,比如眼睛、鼻子、嘴; 属性值(特征值) 属性空间 组成事物或者对象的所有属性的集合; 特征向量 属性空间中的一个点,其实就是一个样本; 空间维数 属性空间中属性的个数; 分类(classification) 预测结果为离散值的学习,如“好瓜”、“坏瓜” 回归(regr...原创 2019-09-22 22:15:19 · 164 阅读 · 0 评论 -
过拟合
过拟合:当学习器学习能力过于强大的时候,很可能已经把训练样本自身的一些特点当作了所有潜在样本都会具有的一般性质,这样就会导致泛化性能下降,训练出来的模型在训练集上表现很好,但是在测试集上表现较差的一种现象;1. 模型出现过拟合现象的原因1)数据有噪声;模型会尽量去覆盖噪声;如下图为一组数据的真实分布为线性:此时我们通过部分数据训练模型,再加上噪声的影响。训练出来的数据分...原创 2019-09-23 09:44:46 · 1328 阅读 · 0 评论 -
模型选择与评估
在现实任务中,我们往往有多种学习算法可供选择,甚至对同一个学习算法,当使用不同的参数配置时,也会产生不同的模型.。那么,我们该选用哪一个学习算法、使用哪一种参数配置呢?这就是机器学习中的"模型选择" (model selection) 问题。我自己总结的模型选择具体分为以下几步:1)选择训练集、测试集;测试集应该尽可能与训练集互斥, 即测试样本尽量不在训练集中出现、未在训练过程中使用过...原创 2019-09-23 11:25:38 · 198 阅读 · 0 评论 -
机器学习模型的性能度量
对于一个模型,使用不同的性能度量,有可能会导致不同的评判结果。评判一个模型是否为好的,不仅取决于算法和数据,还决定于任务需求;1. 错误率和精度(最常用的两种性能度量)错误率是分类错误的样本数占样本总数的比例;精度 = 1 - 错误率 ;2. 查准率、查全率 、F1以二分类问题为例,可将样例根据真实情况和学习器预测结果的组合分为真正例TP、假正例FP、真反例TN、假反例FN;...原创 2019-09-25 10:50:01 · 409 阅读 · 0 评论