- 博客(3)
- 收藏
- 关注
原创 1..groupby() 2.df.agg() 3.缺失值可视化分析4.特征之间关系可视化展示5.将两列去平均6.seaborn绘制线性回归函数 7.把列中连续值进行分类8.统计df内部数据特征
https://github.com/ResidentMario/missingno import missingno as msno 缺失值可视化展示 sns.distplot(df['列名‘],kde=False) 可以画出上面skintone的分布柱形图 seaborn绘制线性回归函数 把列中连续值进行分类 统计df...
2019-05-30 15:25:16
168
原创 1.类别不平衡 2. 删除缺失值的行或者列3. 输出表中某一行 4.转换表的数据5.删除只有一种数值的无用特征列6.查看每一列缺失值的总个数 8.将字符串类型转换为字符型
类别不平衡:假如样本中反例数目多,正例数目少 (西瓜书67页) 下采样(去除一些反例) 上采样(增加一些正例) 阈值移动(再缩放) 删除缺失值的行或者列 df.iloc[ 数字] 可以输出对应的行 iloc是按照index(也就是内部数据的行数)的序值. loc按照index的具体值 转换表的数据 (inplace=True代表更改源文件) 删除只有一种数值的无用特征...
2019-05-27 19:48:07
586
原创 1 . DataFrame.reset_index 2. 交叉验证 3.多分类DataFrame 返回最大值索引 4.删除缺失值 5.某一列值的个数 6.切分
DataFrame.reset_index(level=None, drop=False, inplace=False, col_level=0, col_fill='') 重新设计索引,将原来的索引转换成列,放入表格。 内部参数drop=True : 删掉原来的索引。 交叉验证 将DataFrame指定列排序 多分类DataFrame 返回最大值索引 删除...
2019-05-26 21:23:17
303
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人