自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(2)
  • 收藏
  • 关注

原创 数据特征工程(二)

数据分析第二天数据标准化1、将数据的取值缩放到一定范围内2、减少不同属性间因不同量级造成的权重问题3、数据量级过大会导致收敛的速度下降from sklearn.preprocessing import StandardScaler,MinMaxScaler,RobustScaler#z-score标准化(均值为 0,方差为1)zscore = StandardScaler()df_zscore = zscore.fit_transform(df)#min-max标准化(取值为[0,1])

2021-06-03 21:03:00 71

原创 数据特征工程(一)

数据分析第一天学习笔记 特征工程数据预处理1、需要删除的数据:人为数据,比如序号1,2,3(像数据库中自增的键),这些数据反应不了任何分布,删除2、变化非常小的数据,方差可能无限接近0,过于平稳,该类数据可以看成恒定数据,删除(可以对数据方差设置阈值,小于这个阈值的直接不考虑)缺失值处理缺失值产生的原因:花式百样(总归是数据缺失了)处理方法:1.我们对Markdown编辑器进行了一些功能拓展与语法支持,除了标准的Markdown编辑器功能,我们增加了如下几点新功能,帮助你用它写博客:

2021-06-01 18:13:29 77

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除