机器学习笔记
流沙没尘居士
这个作者很懒,什么都没留下…
展开
-
经验误差与过拟合
1. 经验误差一般在分类问题中,我们把分类错误的样本数占样本总数的比例称作“错误率”,即如果在m个样本中有a个样本分类错误,则错误率为E=a/m;则相对的,1-E称为精度,即精度=1-错误率。更一般的,我们把学习器的实际预测输出与样本的真实输出之间的差异称为误差,学习器在训练集上的误差称为训练误差或经验误差,在新样本上的误差称为测试误差或泛化误差。2. 过拟合不过,当模型把训练样本学得“太好”时,很可能已经把训练样本自身的一些特点当作了所有潜在样本都会具有的一般性质,这样会致使泛化性能的下降,这种现原创 2021-04-05 09:15:05 · 431 阅读 · 0 评论 -
机器学习的类型简介
机器学习可以分为三大部分1.监督学习(Supervised Learning)2.无监督学习(Unsupervised Learning)3.强化学习(Reinforcement Learning)1. 监督学习(Supervised Learning)定义:利用一组已知类别的样本调整分类器的参数,使其达到所要求性能的过程,也称为监督训练或有导师学习。即根据已有的数据集,知道输入和输出结果之间的关系。 监督学习是从标记的训练数据来推断一个功能的机器学习任务。 常见的有监督学习算原创 2021-04-03 08:40:20 · 2382 阅读 · 1 评论 -
数据预处理之--标准化
1.数据预处理简介数据预处理的两个关键是数据规范化和特征缩放。方法包括应用仿射法在保持数据完整性的前提下,将当前不平衡的数据映射到更易于处理的形状中,使其表现出更好的随机属性并改进模型。标准化的一般目标是通过数据规范化和特征缩放使数据分布更接近正态分布。2.规范化和特征缩放数据集预处理中一个非常重要的步骤是规范化和特征缩放。数据规范化将使得优化方法,特别是迭代方法,收敛得更好,并使数据更易于处理。3.规范化或标准化规范化或标准化旨在赋予数据集具有平均值为0、标准差为1的标准正态分布属性,获得标准正原创 2021-04-06 19:14:38 · 1164 阅读 · 0 评论