一、数据分析的步骤
- 明确问题(提出问题)
- 理解数据
- 数据清洗(数据预处理)【重要】
- 数据分析 或 构建模型
- 数据可视化
二、分步拆解,主要记录常用Excel操作技能
【数据集】
招聘网站数据-原始数据.xls
1.9M
·
百度网盘
1.明确问题
比如:数据分析薪水高吗?去哪个城市工作?发展前景如何?
2.理解数据
理解数据每一列表示什么。
Excel三种数据类型:字符串(不能计算,左对齐)、数值(右对齐)、逻辑(true or false)
3.数据清洗【重要】
①选择子集
方法:根据需要选择要显示的列,尽量用隐藏功能,不要删除,以免后续需要使用。
取消隐藏:
②列名重命名
方法:双击列名修改即可
③删除重复值
④缺失值处理
方法:
【第一步】选整列,看右下角计数,和其他列对比,查看有多少缺失值
【第二步】快速定位空值
【第三步】定位出若干缺失值后,人工填写,按ctrl+enter,定位出的缺失地方都会补全
处理方法可以有:人工、统计模型、平均值(此次为人工填写)