自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 收藏
  • 关注

原创 机器学习数据预处理——特征选择

引言  在机器学习的训练过程中,总是会碰到样本大、特征多的数据集。而这些数据集里面的数据有些是用处很小甚至完全无用的。如果一组数据中的无用数据占比较大时,一方面会使得模型的训练时间变长,另一方面模型容易出现欠拟合现象;而如果一组数据中作用较小的数据,即在训练中不能较好体现数据集中样本特征的数据,这类数据占比较大时,除了会提升模型训练的时间以外,还容易引起模型的过拟合现象。  针对这种情况,我们需要对这组数据集进行数据的预处理,其主要的方法有降噪、特征选择以及降维处理,而这次主要讲解如何进行特征选择以及特

2022-01-30 16:52:55 3223

原创 蓝桥杯python(题目思路即解答(笔记))

这篇文章是为蓝桥杯做准备时顺便做的笔记,用来讨论即参考用的,如有错误欢迎指正,有更好的方法也可以提出来一起讨论,谢谢各位大佬们orz因为本人不会VIP,只能刷蓝桥杯里面的普通题,还请见谅orz注:代码中的input别尚自加东西进去,会报错。别问,问就是血淋淋的教训,改了半个小时的代码QAQ基础练习A+B问题content = input()str_list = content.split(' ')int1 = int(str_list[0])int2 = int(str_list[1])r

2022-01-16 23:28:50 1717 5

原创 机器学习数据预处理——降维

引言  在机器学习的训练过程中,总是会碰到样本大、特征多的数据集。而这些数据集里面的数据有些是用处很小甚至完全无用的。如果一组数据中的无用数据占比较大时,一方面会使得模型的训练时间边长,另一方面模型容易出现欠拟合现象;而如果一组数据中作用较小的数据,即在训练中不能较好体现数据集中样本特征的数据,这类数据占比较大时,除了会提升模型训练的时间以外,还容易引起模型的过拟合现象。  针对这种情况,我们需要对这组数据集进行一个数据的预处理,其主要的方法有降噪、特征筛选以及降维处理,而这次主要讲解如何进行降维处理以

2022-01-15 13:14:33 4102

原创 基于机器学习的数据不平衡问题处理

基于机器学习的数据不平衡问题处理为什么要处理数据不平衡问题数据不平衡问题的处理方法欠采样过采样单分类算法其它为什么要处理数据不平衡问题数据不平衡问题是现实生活中十分常见的一个问题,如上市公司的破厂预测,冠心病人的预测,癌症患者的预测等等。这些问题的样本数据往往出现一边倒的形势,而若不做处理直接用传统的机器学习方法进行模型训练的话,容易使训练出来的模型偏向样本多的那一方,导致样本少的一方的预测效果很差,而这些问题中大部分都更加注重样本少的一方的准确率。数据不平衡问题的处理方法既然已经有上面的这些问题,

2021-08-29 12:14:28 1253 1

原创 拉格朗日插值原理讲解及代码实现

拉格朗日插值定义拉格朗日插值是利用已知的若干个节点X,

2021-06-06 14:44:23 9312 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除