大数据可视化技术与应用第二版微课视频版清华大学出版社第八章实训

做完第八章实训才发现同组有人做完交了,做都做了,实验简单,发布一下,后来人省事点。

事先声明:老师检查比较水,实验也比较水,需要安装一些库

一、实验目的

了解大数据可视化的特点,能够进行简单的与大数据可视化有关的操作,能绘制不同的可视化图表

二、实验设备

多媒体计算机 Windows 操作系统

python

三、实验内容

1.使用各种库制作数据可视化图表

、实验程序及调试记录(根据实验步骤逐项记录关键方法,现象及结果)

1.1 制作带颜色的柱形图

import matplotlib.pyplot as plt
plt.rcParams['font.sans-serif'] = ['SimHei']#设置字体
plt.rcParams['axes.unicode_minus'] = False#设置负号
x = ['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H']  # 通常 x 轴是分类标签,这里假设你希望用字母表示  
y = [30, 11, 42, 53, 81, 98, 72, 25]  
labels = ['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H']  # 注意这里其实和 x 是重复的,除非你希望自定义刻度标签  
  
plt.bar(x, y, align='center', color='blue', tick_label=labels, hatch='', ec='gray')  # 修改了 color 参数  
plt.xlabel(u'样品编号')  
plt.ylabel(u'库存数量')  
plt.title('带颜色的柱状图')

plt.show()

运行结果如图所示:

1.2绘制堆叠柱状图,代码如下:

import numpy as np
import matplotlib.pyplot as plt
plt.rcParams['font.sans-serif'] = ['SimHei']#设置字体
x=[1,2,3,4]
y=[5,7,3,6]
plt.bar(x,y,color='c',label='男生')
y1=[3,4,7,2]
plt.bar(x,y1,bottom=y,color='r',label='女生',tick_label=['一班','二班','三班','四班'])
plt.legend()
plt.title('男女人数对比')
plt.show()

运行结果如图所示:

 

1.3绘制数学函数图,代码如下:

from bokeh.plotting import figure, output_file, show
import numpy as np
plt.rcParams['font.sans-serif'] = ['SimHei']#设置字体
plt.rcParams['axes.unicode_minus'] = False#设置负号
 
x=np.linspace(0.05,10,1000)
y=np.sin(x)
z=np.cos(x)
plt.plot(x,y,ls='-',lw=2,color='green',label='plot figure')
plt.plot(x,z)
plt.title('数学函数')
plt.legend()
plt.show()

 

运行结果如图所示:

 

 

1.4使用seaborn绘制组合图形(柱状图和折线图)

代码如下:

import matplotlib.pyplot as plt
import numpy as np
import pandas as pd
from scipy import stats,integrate
import seaborn as sns

sns.set()
x=[1,3,5,7,9,11,13,15,17,19]
y_bar=[3,4,6,8,9,10,9,11,7,8]
y_line=[2,3,5,7,8,9,8,10,6,7]
plt.bar(x,y_bar)
plt.plot(x,y_line,'-o',color='y')
plt.show()

运行结果如图所示:

1.5使用bokeh绘制多个三角形图

代码如下:

from bokeh.plotting import figure, output_file, show
output_file("patch.html")
p = figure(width=400, height=400)
p.patch([1, 3, 5], [5, 8, 5], alpha=0.5, line_width=2)
p.patch([2, 3, 4], [5.5, 7, 5.5], alpha=0.3, line_width=2)

 运行结果如图所示:

1.6使用pyqtgraph绘制曲线图

代码如下:

import pyqtgraph as pg
import numpy as np
app=pg.mkQApp()
x=np.linspace(2,10*np.pi,100)
z=np.cos(x)
pg.plot(x,z)
app.exec_()

  运行结果如图所示:

 

1.7使用numpy和matplotlib在一张图中绘制多种图形

代码如下:

import matplotlib.pyplot as plt
import numpy as np
x = np.linspace(0, 10, 100)
y =2*np.cos(x)**5 + 3*np.sin(x)**3
#定义画布和子图数量
fig,axes=plt.subplots(2,3,figsize=(10,6),facecolor='#ccddef')
#添加整个画布的标题
fig.suptitle('Photo',fontsize=20)
#利用text属性添加副标题
#折线图
axes[0,0].plot(x,y)
#柱状图
axes[0,1].bar(x,y*y)
#直方图
axes[0,2].hist(y,bins=30)
#散点图
axes[1,0].scatter(x,y)
#条形图
axes[1,1].barh(x,y)
#饼图
axes[1,2].pie([1,2,3,4,5],labels=['A','B','C','D','E'])
#对子图进行详细设置
ax1=axes[0,0]
#设置子图的xy轴范围,子图标题,标签背景颜色等
ax1.set(xlim=[-10,12],ylim=[-6,4], facecolor='#ffeedd')
#添加网格
ax1.grid(True)
#调整图表位置和间距
fig.subplots_adjust(left=0.2, bottom=0.1, right=0.8, top=0.8,hspace=0.5)
plt.show()

运行结果如图所示

1.8numpy与pandas绘图

代码如下

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
plt.rcParams['font.sans-serif'] = ['SimHei']#设置字体
data=pd.DataFrame(np.arange(16).reshape((4,4)),columns=['北京','上海','天津','重庆'],
index=[str(i)+'月'for i in np.arange(1,5)])
print(data)
data.plot()
plt.title('四个城市的对比')
plt.show()
data1=data['北京'].plot()
plt.title('北京数据')
plt.show()

 运行结果如图所示

六、结果分析及问题讨论

 结果分析:我们了解了大数据可视化的特点,能够进行简单的与大数据可视化有关的操作,能够制作大数据可视化图表,并进行实验结果的可视化展示。

问题讨论:在制作图表的时候,需要选择合适的图表类型来展示数据,不同类型的图表适用于不同的数据展示需求。确保图表清晰、易读十分重要,应当避免图表过于复杂或信息量过载,以便观众能够快速理解和获取信息。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值