基于房地产信息的数据可视化

基于房地产信息的数据可视化

在这次可视化项目设计中,我选用的是有关于房地产信息的主题,在选用数据方面选择了一个中国不掉热度的热点话题,房地产行业的数据可视化。在选取数据的过程中还是比较困难的,要选择合适的数据并将这些数据通过图表的方式,让数据显示出来,主要的难点是图表的选择是否能够展现这些数据所要表达的东西。为了避免数据的重复性,需要寻找不同方向的数据,例如有的数据为了表现数据大小,有的数据为了表示单一的变化趋势,还有的表现区域之间的变化。在图标的选择上,根据每张图所要表达的含义来对图表进行选择,用图表让数据所要表达出的意思更加直观。在制作图表的过程中,从让数据显示,到不断增加图表细节,让图表清晰,可观性高,在这个过程中还是出现了很多问题,例如图例重叠无法正常显示,数据所展现的效果与自己预期的不相符,需要不断的对代码进行处理,还是挺折磨的。在使用一些功能代码对图表进行处理后,对图标所展现出的效果还是比较满意的,对于几个可视化的库也是有了进一步的理解,希望自己能在之后的可视化制作中的数据能使用爬虫,不再是自己手动打入数据来,满满一学期的数据可视化收获还是挺大的,不管是从代码方面还是心理方面,打代码的方式更加熟练,在出现问题时心理也有了更加平和的心态了,在日后的学习中也是有了更多的帮助。
目录
目录 II
1 概述 1
2.房地产词云 2
2.1 图表名称 2
2.2 Python库及版本 2
2.3 数据来源 2
3.2020年1-9月房地产行业信用债发行情况 4
3.1 图表名称 4
3.2 Python库及版本 4
3.3 数据来源 4
3.4 图表效果 4
3.5 图表含义描述 4
3.6 核心代码解析 5
4.2020年房地产完成率销售占比 5
4.1 图标名称 5
4.2 Python库及版本 5
4.3 数据来源 5
4.4 图表效果 6
4.5图表含义描述 6
4.6核心代码解析 6
5 . 主要城市近六个月住宅用地楼面价走势 6
5.1 图标名称 6
5.2 Python库及版本 7
5.3 数据来源 7
5.4 图表效果 7
5.5 图表含义描述 7
5.6 核心代码解析 8
6.2020年7、8、9月土地成交面积 8
6.1 图表名称 8
6.2 Python库及版本 8
6.3 数据来源 8
6.4 图标效果 9
6.5 图标描述及含义 9
6.6 核心代码解析 9
7. 2020年2月31省份房地产投资开发情况 10
7.1 图表名称 10
7.2 Python库及版本 10
7.3 数据来源 10
7.4 图表效果 10
7.5 图表含义描述 10
7.6 核心代码解析 11
8. 中国房地产企业销售业绩TOP10(1-11月) 11
8.1 图表名称 11
8.2 Python库及版本 11
8.3数据来源 11
8.4 图表效果 12
8.5 图表含义描述 13
8.6 核心代码解析 14
9. 中国房地产销售50亿以上企业 14
9.1 图标名称 14
9.2 Python库及版本 14
9.3 数据来源 14
9.4 图表效果 15
9.5 图表及含义 15
9.6 核心代码解析 15
1概述
这里简单介绍选用的主题、数据的来源、报告中涉及的图表、开发语言、开发工具等。

本报告包括的图表如表1-1所示:

表1-1 报告中的图表
序号 图表标题 图表名称 Python可视化库 备注
1 房地产词云 词云图 word’cloud
2 2020年1-9月房地产行业信用债发行情况 柱状图 matplotlib
numpy
3 2020年房地产完成率销售占比 饼图 matplotlib
4 主要城市近六个月住宅用地楼面价走势 面积堆叠图 matplotlib
5 2020年7、8、9月土地成交面积 柱状堆叠图 pandas
pyecharts
6 2020年2月31省份房地产投资开发情况 热力图 pyecharts
7 中国房地产企业销售业绩TOP10(1-11月) 南丁格玫瑰图 pyecharts
8 中国房地产销售50亿以上企业 柱状图 seaborn

本报告涉及的图表开发技术如表1-2所示。
表1-2	开发技术简介

在这里插入图片描述
2.房地产词云
2.1 图表名称
词云
2.2 Python库及版本
Jieba 0.42.1
Wordcloud 1.8.0
random
imageio
2.3 数据来源
https://data.stats.gov.cn/tablequery.htm?code=AA130O
2.4 图表效果
原始图
在这里插入图片描述
导入txt文件后
在这里插入图片描述
2.5 图表含义及描述
房地产的关键词,通过jieba库的分词功能,构成一个房屋的形状
2.6 核心代码及解析
词云图使用的关键词是房地产,通过wordcloud库来实现。其中个人姓名以最大的方式显现在图片中。使用random函数让名字多次出现在读入的文本中,次数出现最多即可显示出最大的效果。
3.2020年1-9月房地产行业信用债发行情况

3.1 图表名称
渐变色柱状图

3.2 Python库及版本
matplotlib
numpy

3.3 数据来源
https://www.sohu.com/a/421953282_415900
3.4 图表效果
在这里插入图片描述
3.5 图表含义描述
横坐标为月份,纵坐标为信用债发行金额
柱上方数值表示该柱代表的大小

3.6 核心代码解析
在这里插入图片描述
通过对单位矢量V定义梯度方向,拐角处的值通过V上的矢量投影长度获取,来形成颜色的渐变效果。需要对象,边界,渐变方向,cmap与范围,其中核心部分为imshow函数的调用

4.2020年房地产完成率销售占比

4.1 图标名称
层次饼图
4.2 Python库及版本
matplotlib
4.3 数据来源
https://www.sohu.com/a/435475486_336091
4.4 图表效果
在这里插入图片描述
4.5图表含义描述
该图表为各企业2020年销售房产完成率的占比,其中占比最大的部分分离的效果最大,让整张图看起来有种拼接效果,并在模块部分设置了阴影,看起来有立体效果,在每一部分的颜色也设置为特定颜色,并有文本显示。

4.6核心代码解析
在这里插入图片描述
设置第一个数据起始位置,字体与数据部分间的距离,阴影效果以及颜色
通过plt.pie方法即可生成饼图。

5 . 主要城市近六个月住宅用地楼面价走势
5.1 图标名称
面积堆叠图
5.2 Python库及版本
matplotlib
5.3 数据来源
https://fdc.fang.com/data/land/detail.aspx
5.4 图表效果
在这里插入图片描述
5.5 图表含义描述
该图为城市近六个月住宅用地楼面价走势,其中类型为面积堆叠图,x代表月份,y代表元/m^2,每一种颜色代表一个城市,其中面积之间的落差反应两座城市之间楼面价的变化程度。
5.6 核心代码解析
在这里插入图片描述
该部分代码为图表的属性设置,与生成面积堆叠图,还有对应的文本显示,要在图中显示每一个转折点的数据,需要将之前城市间的数值进行累加,并存入数组显示在图像中。

6.2020年7、8、9月土地成交面积
6.1 图表名称
柱状堆叠图
6.2 Python库及版本
pandas
pyecharts
6.3 数据来源
https://fdc.fang.com/data/land/detail.aspx
6.4 图表效果
在这里插入图片描述
6.5 图标描述及含义
该图为三个月三个城市中土地成交面积,横坐标为城市名称,纵坐标代表面积大小,橘色表示每个城市7月份的土地成交面积,蓝青色表示每个城市8月份的土地成交面积,粉色表示每个城市9月份的土地成交面积,在每个城市柱状右边设置了三个月的总面积。

6.6 核心代码解析
在这里插入图片描述
该段代码为柱状图的属性,其中每一段y都是通过7月份部分+8月份部分+9月份部分,在最后添加总面积量,并对每个柱的每一块部分设置相应的颜色。

  1. 2020年2月31省份房地产投资开发情况
    7.1 图表名称
    热力图
    7.2 Python库及版本
    pyecharts
    7.3 数据来源
    https://www.sohu.com/a/384966360_267106
    7.4 图表效果

在这里插入图片描述
7.5 图表含义描述
该图为热力图,数据为2月份每个省房地产投资开发情况,根据数据的不同,每个点数据所在的范围为一个颜色,鼠标移动至点上会显示省份和数值。
7.6 核心代码解析
在这里插入图片描述
设置地图为中国地图
Labelopts设置是否显示数值
type为点的类型
visualmap_opts=opts.VisualMapOpts(max_=1400)设置颜色变化和取值范围
maptype=“china”, itemstyle_opts=opts.ItemStyleOpts(color=‘skyblue’,border_color=‘orange’)
设置的是地图的背景色

  1. 中国房地产企业销售业绩TOP10(1-11月)
    8.1 图表名称
    南丁格玫瑰图
    8.2 Python库及版本
    pyecharts
    8.3数据来源
    https://www.sohu.com/a/435475486_336091
    8.4 图表效果
    在这里插入图片描述
    在这里插入图片描述
    8.5 图表含义描述
    此图为玫瑰图,每一块表示一家房地产企业,在块上标注有企业销售业绩的数值,在上方的图例中点击某一企业,可将企业从玫瑰图中移除,再次点击可出现。
    8.6 核心代码解析
    在这里插入图片描述
    通过radius 设置玫瑰瓣的弧度及大小
    用全局变量的is_show=True 来在图中显示数据

9.中国房地产销售50亿以上企业
9.1图标名称
柱状图
9.2Python库及版本
Seaborn
9.3数据来源
https://www.sohu.com/a/435475486_336091
9.4图表效果
在这里插入图片描述
9.5图表及含义
该图x轴代表的是每个企业的名称,y轴为企业所对应的销售额,使用seaborn库自带的柱状图设置,让每一个柱的颜色都不同
9.6核心代码解析
在这里插入图片描述
plt.xticks(rotation=’vertical’)可将x轴的字体变成垂直显示,以免水平显示时出现字体重叠的现象

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值