自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(3)
  • 收藏
  • 关注

原创 【无标题】

比较检验1.假设检验定义:对总体参数提出一个假设值,然后利用样本信息判断这一假设是否成立 2.交叉验证t检验 3.McNemar检验 4.Friedman检验优缺点: 5.Nemenyi后续检验 线性回归: 对数回归: 多分类学习: 类别不平衡时的解决办法?从数据角度:扩充数据集、过采样、欠采样、数据合成、居于异常检测的方式从算法角度:尝试不同的分类算法、对小类错分进行加权惩罚从重构分类器的角度:将你的大类压缩成小类、使用One Class分类器、使用集成方式训练多个分类器然后联合这些分类器进行分类、

2022-07-07 17:11:08 78 1

原创 第二章部分总结

错误率:分类错误的样本数占样本总数的比例。E = a / m精度:1 - a / m误差:学习器的实际预测输出与样本真实输出之间的差异。训练误差、经验误差:学习器在训练集上的误差。泛化误差:学习器在新样本上的误差。过拟合:已经把训练样本自身的一些特点当作了所有潜在样本都会具有的一般性质,这会导致泛化性能下降。是机器学习面临的关键障碍。欠拟合:对训练样本的一般性质尚未学好。过拟合产生的原因?1. 训练集的数量级和模型的复杂度不匹配。训练集的数量级要小于模型的复杂度;2. 训练集

2022-07-05 18:50:11 235

原创 机器学习西瓜书第一章总结

机器学习:研究如何通过计算的手段,利用 经验改善系统自身的性能。1.训练模型 数据集:一组数据记录的集合。 实例或样本:每条记录是关于一个事件或对 象的描述。 属性:反映事件或对象在某方面的表现或性 质的事项。 属性值:属性上的取值。 属性空间、样本空间或输入空间:属性张成 的空间。 特征向量:在上述张开空间中每个样本都能 找到自己对应的点,而每一个点都对应一个 向量坐标。 属性值:属性上的取值。 学习或训练:从数据...

2022-07-03 12:56:43 326

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除