自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(3)
  • 收藏
  • 关注

原创 关于样本不均衡问题的处理

关于样本不均衡问题的处理 样本分布不均衡是导致模型效果差的重要原因之一,常用的处理该问题的方式有两种,分别为:上采样和下采样!然而,两种方式虽然都可以处理样本不均衡问题,但往往效果差强人意!今天,我将就处理样本不均衡问题,谈一下自己的浅薄认识,有不足之处,希望批评指正! 关于传统的SMOTE上采样法,其基于的原理为:对于少数类样本a, 随机选择一个最近邻的样本b, 然后从a与b的连线上随机选取一个点c作为新的少数类样本; 但是,SMOTE容易出现过泛化和高方差的问题,而且,容易制造出重叠的数据。 为了克服S

2021-11-23 14:06:54 669

原创 机器学习总结之数据预处理与特征工程

数据是未来企业最重要的财富,然而,很多企业却是守着金山愁饭吃的状态。那么,如何让数据变成财富来造福企业呢?这就离不开数据分析了。当然,数据分析是一个比较宽泛的概念,其包含很多板块,我们这里着重以如何让数据变得有”智慧“的机器学习开始谈起! 数据固然是企业宝贵的财富,但如果不懂得如何使用这笔财富,那它也只能沉睡在垃圾桶里。要想发挥它的价值,就只有聪明的数据“矿工”才能做到。 的却,数据的处理和采矿有很多相似的地方,原始的数据,是含有很多杂志的,只有一步步提炼,一步步优化,才能做成天下无敌的宝剑,如何一步步对数

2021-11-03 21:37:01 590

原创 python的对象及垃圾回收机制

python的对象及垃圾回收机制 python中,一切皆对象! 对象由:标识(identity)、类型(type)、value(值) 组成。 标识用于唯一标识对象,通常对应于对象在计算机内存中的地址。使用内置函数 id(obj) 可返回对象 obj 的标识。 类型用于表示对象存储的“数据”的类型。类型可以限制对象的取值范围以及可执行的 操作。可以使用 type(obj)获得对象的所属类型,如(a=3,则type(a)为int) 值表示对象所存储的数据的信息。使用 print(obj)可以直接打印出值。

2021-05-13 22:31:48 128

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除