王肖95-CSDN博客

原创【无标题】

比较检验1.假设检验定义：对总体参数提出一个假设值，然后利用样本信息判断这一假设是否成立 2.交叉验证t检验 3.McNemar检验 4.Friedman检验优缺点： 5.Nemenyi后续检验线性回归：对数回归：多分类学习：类别不平衡时的解决办法?从数据角度：扩充数据集、过采样、欠采样、数据合成、居于异常检测的方式从算法角度：尝试不同的分类算法、对小类错分进行加权惩罚从重构分类器的角度：将你的大类压缩成小类、使用One Class分类器、使用集成方式训练多个分类器然后联合这些分类器进行分类、

2022-07-07 17:11:08 97 1

原创第二章部分总结

错误率：分类错误的样本数占样本总数的比例。E = a / m精度：1 - a / m误差：学习器的实际预测输出与样本真实输出之间的差异。训练误差、经验误差：学习器在训练集上的误差。泛化误差：学习器在新样本上的误差。过拟合：已经把训练样本自身的一些特点当作了所有潜在样本都会具有的一般性质，这会导致泛化性能下降。是机器学习面临的关键障碍。欠拟合：对训练样本的一般性质尚未学好。过拟合产生的原因？1. 训练集的数量级和模型的复杂度不匹配。训练集的数量级要小于模型的复杂度；2. 训练集

2022-07-05 18:50:11 255

原创机器学习西瓜书第一章总结

机器学习：研究如何通过计算的手段，利用经验改善系统自身的性能。1.训练模型数据集：一组数据记录的集合。实例或样本：每条记录是关于一个事件或对象的描述。属性：反映事件或对象在某方面的表现或性质的事项。属性值：属性上的取值。属性空间、样本空间或输入空间：属性张成的空间。特征向量：在上述张开空间中每个样本都能找到自己对应的点，而每一个点都对应一个向量坐标。属性值：属性上的取值。学习或训练：从数据...

2022-07-03 12:56:43 354

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

原创 【无标题】

原创 第二章部分总结

原创 机器学习西瓜书第一章总结

空空如也

空空如也

原创【无标题】

原创第二章部分总结

原创机器学习西瓜书第一章总结