自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

刘大大的博客

python数据分析,不忘初心

  • 博客(2)
  • 收藏
  • 关注

原创 解决样本类别分布不均衡的问题

今天学习了关于样本类别分布不均衡的处理的一些知识,在此和大家一起分享一下。什么是样本类别分布不均衡?举例说明,在一组样本中不同类别的样本量差异非常大,比如拥有1000条数据样本的数据集中,有一类样本的分类只占有10条,此时属于严重的数据样本分布不均衡。样本类别分布不均衡导致的危害?样本类别不均衡将导致样本量少的分类所包含的特征过少,并很难从中提取规律;即使得到分类模型,也容易产生过度依赖与有限的数...

2018-05-28 12:29:52 22179 4

原创 终于开始了我的博客写作

本人18届应届毕业生一枚,专业商业分析学,曾经一直渴望加入数据分析师的梯队,也在一直锻炼着自己的数据分析能力,因为在春招中拿到了工行的offer,即将进入银行工作,但是又不想放弃自身的数据分析能力,所以打算在这里记录一些自己在学习数据分析过程中遇到的一些知识点,对自己来说也算是一种复习。谢谢各位大家捧场,有不足之处请各位大佬直接指出,一起学习!...

2018-05-27 23:01:39 430

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除