![](https://img-blog.csdnimg.cn/20201014180756738.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
数据处理
格林黄
这个作者很懒,什么都没留下…
展开
-
四分位数和箱线图
四分位数四分位数(Quartile)也称四分位点,是指在统计学中把所有数值由小到大排列并分成四等份,处于三个分割点位置的数值。箱线图利用数据中的五个统计量:最小值、第一四分位数、中位数、第三四分位数与最大值来描述数据的一种方法。四分位差:IQR = Q3-Q1,IQR(interquartile range)异常值:OUTLIER<Q1-1.5IQR or OUT...原创 2019-10-28 18:39:20 · 3543 阅读 · 0 评论 -
数据处理-处理缺失值、去除空格值、数据分组、虚拟变量
查看缺失值dataframe.isnull( )填补缺失值向上填充法 .ffill( )向下填充法 .bfill( )将某个特定的值x填充空白值 .fillna(x)删除含有缺失值的样本 .dropna( )trips1.csvstart_id,end_id,start_date0,55,55,'8/29/2013 14:13'1,55,55,'8/...原创 2019-10-21 12:36:10 · 1387 阅读 · 0 评论