一、使用Excel做数据处理方法(博主使用的是2007版本)
打开泰坦尼克生存数据文件,文件共有12列,891行。
1.处理缺失数值
1.1下面先说说几种方便的填充空值的方法
(1)快速填充
双击单元格右下角的黑色十字向下自动填充,然后点击右下角自动填充选项,可以选择填充方式。
船舱这一列有许多空值,如果想要使用这一列进行后续分析就要把空值处理,在这里只用它讲一下快速填充如何使用,不使用这一列进行后续分析。如果想要使用C85向上填充,直杰按住单元格右下角的十字向上拖拽就可以。
填充前
填充后
(2)智能填充-快捷键Ctrl+Enter
利用Ctrl选中所有空的单元格或者使用菜单栏中的查找和选择(开始-查找和选择-定位条件-空格)选择所有的空值单元格,在其中一个空的单元格输入想要数值,然后使用Ctrl+Enter键就能把选中的空值都填上刚才输入的值。
(3)规律填充
例如A1是1,A2是3,想让单元格以等差数列的方式填充,只需选中A1、A2这两个单元格,再双击A2单元格右下角的十字就可以以等差数列的规律填充了。
1.2接下来就是查重
(1)Countif函数
COUNTIF(L2:L892,L2)查找L2在L列中出现几次
COUNTIF(L$2:L2,L2)查找L2是第几次出现
$是绝对引用,L$2表示固定第二行,$L2表示固定L这一列,假如单元格中为L$2:L2,快速填充,下一个单元格是L$2:L3,即使使用快速填充的方式,$2从第二行开始也是不会变的。