自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(3)
  • 收藏
  • 关注

原创 1..groupby() 2.df.agg() 3.缺失值可视化分析4.特征之间关系可视化展示5.将两列去平均6.seaborn绘制线性回归函数 7.把列中连续值进行分类8.统计df内部数据特征

https://github.com/ResidentMario/missingno import missingno as msno 缺失值可视化展示 sns.distplot(df['列名‘],kde=False) 可以画出上面skintone的分布柱形图 seaborn绘制线性回归函数 把列中连续值进行分类 统计df...

2019-05-30 15:25:16 168

原创 1.类别不平衡 2. 删除缺失值的行或者列3. 输出表中某一行 4.转换表的数据5.删除只有一种数值的无用特征列6.查看每一列缺失值的总个数 8.将字符串类型转换为字符型

类别不平衡:假如样本中反例数目多,正例数目少 (西瓜书67页) 下采样(去除一些反例) 上采样(增加一些正例) 阈值移动(再缩放) 删除缺失值的行或者列 df.iloc[ 数字] 可以输出对应的行 iloc是按照index(也就是内部数据的行数)的序值. loc按照index的具体值 转换表的数据 (inplace=True代表更改源文件) 删除只有一种数值的无用特征...

2019-05-27 19:48:07 586

原创 1 . DataFrame.reset_index 2. 交叉验证 3.多分类DataFrame 返回最大值索引 4.删除缺失值 5.某一列值的个数 6.切分

DataFrame.reset_index(level=None, drop=False, inplace=False, col_level=0, col_fill='') 重新设计索引,将原来的索引转换成列,放入表格。 内部参数drop=True : 删掉原来的索引。 交叉验证 将DataFrame指定列排序 多分类DataFrame 返回最大值索引 删除...

2019-05-26 21:23:17 303

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除