Matplotlib基础03：波士顿房价数据集可视化

最新推荐文章于 2024-05-23 13:58:47 发布

雨夜※繁华

最新推荐文章于 2024-05-23 13:58:47 发布

阅读量2.9k

点赞数 4

分类专栏： # tensorflow笔记文章标签：数据分析机器学习可视化数据挖掘 python

本文链接：https://blog.csdn.net/qq_44861675/article/details/104413287

版权

tensorflow笔记专栏收录该内容

14 篇文章 2 订阅

订阅专栏

Matplotlib基础03：利用已学知识绘制boston房价的影响因素表

波士顿房价数据集介绍

在这里插入图片描述

散点图描绘这些因素对房价的影响

1.我们先下载数据集

boston = tf.keras.datasets.boston_housing
#加载数据，分训练集与测试集
(train_x,train_y),(test_x,test_y) = boston.load_data(test_split=0) #我们让测试数据为0，这里的test_split是划分数据集中测试集的比例的

print(len(train_x))
print(len(test_x))

会出现下载
在这里插入图片描述
2.访问数据集中的元素

3.分割数据x，分别画散点图

import matplotlib 
import matplotlib.pyplot as plt
import numpy as np 
import tensorflow as tf 
boston = tf.keras.datasets.boston_housing
#加载数据，分训练集与测试集
(train_x,train_y),(test_x,test_y) = boston.load_data(test_split=0) #我们让测试数据为0

print(len(train_x))
print(len(test_x))

print(train_x.shape)#(506,13)
print(train_y.shape)#(506,)
factor = ['城市人均犯罪率',"超过25000平方英尺的住在用地所占比例",
"城镇非零售业的商业用地所占比例","是否被Charles河流穿过",
"一氧化碳浓度","每栋住宅的平均房间数",
"早于1940年建成的自住房屋比例 ","到波士顿5个中心区域的加权平均距离",
"到达高速公路的便利指数","每10000美元的全值财产税率","城镇中师生比例 ",
"反映城镇中的黑人比例的指标","低收入人口的比例 ",
"自住房屋房价的平均房价（单位为1000美元） "]
#下面开始绘制图片
#由shape我们知道x里边影响房价的有13个因素，对应着房价
#我们现在要做的就是将这些因素一一与房价分析
#配置中文与负号
plt.rcParams['font.family'] = 'SimHei'
plt.rcParams["axes.unicode_minus"] = False
plt.figure(num='13辅图',figsize=(13,10))

#第一步，逐一取出这些因素
for i in range(13):
    #划分子图
    plt.subplot(4,4,i+1)
    #绘制散点图
    plt.scatter(train_x[:,i],train_y,s=3)
    #设置纵坐标
    plt.ylabel("prices($1000's)")
    #设置子图题目
    plt.title(factor[i],loc="left",backgroundcolor='red')
#设置填充
plt.tight_layout()
#设置全局标题
plt.suptitle("各个因素与房价的关系",backgroundcolor='y',verticalalignment='bottom')
plt.show()