一、数据分析步骤
数据分析主要有以下五个步骤:
1、提出问题
2、理解数据
3、数据清洗
4、构建模型
5、数据可视化
二、具体步骤
(一)提出问题
为了更好了解上海二手房市场,
提出以下几个问题:
1)上海房价均价如何
2)哪些地区提供房源量较多
3)户型分布如何
(二)理解数据
本次练习选取的数据为上海二手房信息,来源于网上,共9个字段,总计28201条
![](https://img-blog.csdnimg.cn/20200414184638931.png?x-oss-
process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L2ZvZ19tdXpp,size_16,color_FFFFFF,t_70)
(三)数据清洗
将原始数据保存好后另起一份,防止原始数据丢失。
1)删除重复值
利用【数据】-【删除重复项】进行查重,
添加序号列,使其具有唯一性
2)寻找缺失值
Ctrl+g,定位空值,编辑栏填入null,Ctrl&#