用python-sklearn做广州房价预测——以此为例说明如何使用python做简单的数据分析

0 数据

广州市二手房价数据
广州市二手房价数据
大概有500条广州市二手房价数据

python数据导入

import numpy as np
import pandas as p
#画图包导入
import matplotlib.pyplot as plt
plt.style.use(style="ggplot")
import missingno as msno
import seaborn as sn

plt.rcParams['font.sans-serif'] = ['SimHei']  # 中文字体设置-黑体
plt.rcParams['axes.unicode_minus'] = False  # 解决保存图像是负号'-'显示为方块的问题
sns.set(font='SimHei',style="whitegrid",palette="binary")  # 解决Seaborn中文显示问题

#读取数据
train_names = ["总价(万元)",
               "均价(元/平方米)",
               "房间数",
               "大厅数",
               "所在楼层",
               "总楼层",
               "朝向",
               "房屋结构",
               "装修",
               "面积(平方米)",
               "建成时间",
               "楼龄",
               "所在区域"]
train = pd.read_csv("data_guangzhou.csv",names=train_names,encoding='gb2312')
#train = train.drop(0)
#train = train.dropna()

#直接读取的数据是文本类型,改为数字类型
train['总价(万元)'] = pd.to_numeric(train['总价(万元)']) 
train['均价(元/平方米)'] = pd.to_numeric(train['均价(元/平方米)']) 
train['面积(平方米)'] = pd.to_numeric(train['面积(平方米)']) 
train['房间数'] = pd.to_numeric(train['房间数']) 
train['大厅数'] = pd.to_numeric(train['大厅数']) 
train['总楼层'] = pd.to_numeric(train['总楼层']) 
train['楼龄'] = pd.to_numeric(train['楼龄']) 

1 数据分析

房价分布


plt.figure(figsize = (10,5))
print("skew: ",train["总价(万元)"].skew())
sns.distplot(train["总价(万元)"],
  • 7
    点赞
  • 41
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 10
    评论
评论 10
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

奇迹523

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值