- 博客(3)
- 收藏
- 关注
原创 关于样本不均衡问题的处理
关于样本不均衡问题的处理 样本分布不均衡是导致模型效果差的重要原因之一,常用的处理该问题的方式有两种,分别为:上采样和下采样!然而,两种方式虽然都可以处理样本不均衡问题,但往往效果差强人意!今天,我将就处理样本不均衡问题,谈一下自己的浅薄认识,有不足之处,希望批评指正! 关于传统的SMOTE上采样法,其基于的原理为:对于少数类样本a, 随机选择一个最近邻的样本b, 然后从a与b的连线上随机选取一个点c作为新的少数类样本; 但是,SMOTE容易出现过泛化和高方差的问题,而且,容易制造出重叠的数据。 为了克服S
2021-11-23 14:06:54
669
原创 机器学习总结之数据预处理与特征工程
数据是未来企业最重要的财富,然而,很多企业却是守着金山愁饭吃的状态。那么,如何让数据变成财富来造福企业呢?这就离不开数据分析了。当然,数据分析是一个比较宽泛的概念,其包含很多板块,我们这里着重以如何让数据变得有”智慧“的机器学习开始谈起! 数据固然是企业宝贵的财富,但如果不懂得如何使用这笔财富,那它也只能沉睡在垃圾桶里。要想发挥它的价值,就只有聪明的数据“矿工”才能做到。 的却,数据的处理和采矿有很多相似的地方,原始的数据,是含有很多杂志的,只有一步步提炼,一步步优化,才能做成天下无敌的宝剑,如何一步步对数
2021-11-03 21:37:01
590
原创 python的对象及垃圾回收机制
python的对象及垃圾回收机制 python中,一切皆对象! 对象由:标识(identity)、类型(type)、value(值) 组成。 标识用于唯一标识对象,通常对应于对象在计算机内存中的地址。使用内置函数 id(obj) 可返回对象 obj 的标识。 类型用于表示对象存储的“数据”的类型。类型可以限制对象的取值范围以及可执行的 操作。可以使用 type(obj)获得对象的所属类型,如(a=3,则type(a)为int) 值表示对象所存储的数据的信息。使用 print(obj)可以直接打印出值。
2021-05-13 22:31:48
128
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人