8.链家数据分析

本文详细介绍了如何进行链家数据的分析,包括导入数据库、数据预处理如处理重复值和空值、数据类型转换、户型信息的转换。接着,通过图表对房源的数量和位置分布进行了深入分析。最后,提供了包含完整分析资料的百度云盘链接。
摘要由CSDN通过智能技术生成


1.导入数据库

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns

2.导入数据

# 读取链家北京租房信息 
file_data = pd.read_csv('./2.code/data/链家北京租房数据.csv') 
file_data.head(10)

#查看表数据类型
file_data.info()
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 8223 entries, 0 to 8222
Data columns (total 5 columns):
 #   Column   Non-Null Count  Dtype 
---  ------   --------------  ----- 
 0   区域       8223 non-null   object
 1   小区名称     8223 non-null   object
 2   户型       8223 non-null   object
 3   面积(㎡)    8223 non-null   object
 4   价格(元/月)  8223 non-null   int64 
dtypes: int64(1), object(4)
memory usage: 321.3+ KB

3.数据预处理

3.1 重复值和空值处理

#检测重复值
file_data.duplicated()

#删除重复值
file_data.drop_duplicates(inplace=True)#就地修改

# 检测缺失值
np.all(pd.notnull(file_data)) #返回True证明没有缺失值

# 删除缺失数据
file_data = file_data.dropna()

3.2 数据类型转换

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Padaz

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值