- 博客(5)
- 收藏
- 关注
原创 机器学习数据预处理——特征选择
引言 在机器学习的训练过程中,总是会碰到样本大、特征多的数据集。而这些数据集里面的数据有些是用处很小甚至完全无用的。如果一组数据中的无用数据占比较大时,一方面会使得模型的训练时间变长,另一方面模型容易出现欠拟合现象;而如果一组数据中作用较小的数据,即在训练中不能较好体现数据集中样本特征的数据,这类数据占比较大时,除了会提升模型训练的时间以外,还容易引起模型的过拟合现象。 针对这种情况,我们需要对这组数据集进行数据的预处理,其主要的方法有降噪、特征选择以及降维处理,而这次主要讲解如何进行特征选择以及特
2022-01-30 16:52:55 3425
原创 蓝桥杯python(题目思路即解答(笔记))
这篇文章是为蓝桥杯做准备时顺便做的笔记,用来讨论即参考用的,如有错误欢迎指正,有更好的方法也可以提出来一起讨论,谢谢各位大佬们orz因为本人不会VIP,只能刷蓝桥杯里面的普通题,还请见谅orz注:代码中的input别尚自加东西进去,会报错。别问,问就是血淋淋的教训,改了半个小时的代码QAQ基础练习A+B问题content = input()str_list = content.split(' ')int1 = int(str_list[0])int2 = int(str_list[1])r
2022-01-16 23:28:50 1859 5
原创 机器学习数据预处理——降维
引言 在机器学习的训练过程中,总是会碰到样本大、特征多的数据集。而这些数据集里面的数据有些是用处很小甚至完全无用的。如果一组数据中的无用数据占比较大时,一方面会使得模型的训练时间边长,另一方面模型容易出现欠拟合现象;而如果一组数据中作用较小的数据,即在训练中不能较好体现数据集中样本特征的数据,这类数据占比较大时,除了会提升模型训练的时间以外,还容易引起模型的过拟合现象。 针对这种情况,我们需要对这组数据集进行一个数据的预处理,其主要的方法有降噪、特征筛选以及降维处理,而这次主要讲解如何进行降维处理以
2022-01-15 13:14:33 4294
原创 基于机器学习的数据不平衡问题处理
基于机器学习的数据不平衡问题处理为什么要处理数据不平衡问题数据不平衡问题的处理方法欠采样过采样单分类算法其它为什么要处理数据不平衡问题数据不平衡问题是现实生活中十分常见的一个问题,如上市公司的破厂预测,冠心病人的预测,癌症患者的预测等等。这些问题的样本数据往往出现一边倒的形势,而若不做处理直接用传统的机器学习方法进行模型训练的话,容易使训练出来的模型偏向样本多的那一方,导致样本少的一方的预测效果很差,而这些问题中大部分都更加注重样本少的一方的准确率。数据不平衡问题的处理方法既然已经有上面的这些问题,
2021-08-29 12:14:28 1459 1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人