数据分析:
基础概念:用适当方法对收集来的大量数据进行分析,帮助人们做出判断,以便采取适当行动。
流程:提出问题——准备数据——分析数据——获得结论——成果可视化——...
环境:vscode
matplotlib:python底层绘图库,数据可视化图表。
绘制折线图:
示例一:
from matplotlib import pyplot as plt
x=range(2,26,2)
y=[15,13,14,5,17,20,25,26,24,22,18,15]
plt.plot(x,y)
plt.show()
效果如下:
需要改善的问题:
1、设置图片大小
#figure就是要画的图,figsize表示宽和高,设置图片大小,dpi是像素点个数,让图片更清晰
fig=plt.figure(figsize=(20,8),dpi=80)
2、保存到本地
#保存图片
plt.savefig("./t1.png")
3、描述信息(x轴y轴分别表示什么,这个图表示什么)
#添加描述信息
plt.xlabel("时间")
plt.ylabel("温度 单位(C)")
plt.title("10点到12点每分钟的气温变化情况")
4、调整xy的刻度的间距
#设置x轴的刻度
#plt.xticks(x)
#plt.xticks(range(2,26))
_xtick_lables=[i/2 for i in range(4,49)]
plt.xticks(_xtick_lables[::3])
#调整x轴刻度
_x=list(x)[::3]
_xtick_label=["{}点{}分".format(10+i//60,i%60) for i in _x]
plt.xticks(_x,_xtick_label,rotation=45)#rotation表示旋转的角度
5、线条的样式
plt.plot(x,y_1,label="自己",color="orange",linestyle=":",linewidth=5,alpha=0.4)
color:线条颜色
linestyle:线条风格
linewidth:线条宽度
alpha:透明度
6、标记出特殊的点
7、添加水印
8、设置旋转角度
plt.xticks(_x,_xtick_label,rotation=45)#rotation表示旋转的角度
9、设置显示中文
font = {'family' : 'MicroSoft YaHei',
#'weight' : 'bold',
#'size' : '12'
}
matplotlib.rc("font",**font)
10、绘制表格
#绘制网格
plt.grid(alpha=0.4)
11、添加图例
#添加图例
plt.legend(loc=4)
绘制散点图:
from matplotlib.patches import Polygon
import matplotlib.pyplot as plt
import matplotlib
import matplotlib.font_manager as fm
import math
import random
from numpy import dot
#设置中文
font = {'family' : 'MicroSoft YaHei',
#'weight' : 'bold',
#'size' : '12'
}
matplotlib.rc("font",**font)
y_3=[11,17,16,11,12,11,12,6,6,7,8,9,12,15,14,17,18,21,16,17,20,14,15,15,15,19,21,22,22,22,23]
y_10=[26,26,28,19,21,17,16,19,18,20,20,19,22,23,17,20,21,20,22,15,11,15,5,13,17,10,11,13,12,13,6]
x_3=range(1,32)
x_10=range(51,82)
#设置图形大小
plt.figure(figsize=(20,8),dpi=80)
plt.scatter(x_3,y_3,label="3月份")
plt.scatter(x_10,y_10,label="10月份")
#调整x轴刻度
_x=list(x_3)+list(x_10)
_xtick_labels = ["3月{}日".format(i) for i in x_3]
_xtick_labels += ["10月{}日".format(i-50) for i in x_10]
plt.xticks(_x[::3],_xtick_labels[::3],rotation=45)
plt.legend(loc=1)
plt.xlabel("时间")
plt.ylabel("温度")
plt.title("标题")
plt.show()
绘制(纵向)条形图:
plt.bar(range(len(x)),y,width=0.5)
绘制(横向)条形图:
plt.barh(range(len(x)),y,height=0.5,color="orange")
示例二:
from matplotlib.patches import Polygon
import matplotlib.pyplot as plt
import matplotlib
import matplotlib.font_manager as fm
import math
import random
#设置中文
font = {'family' : 'MicroSoft YaHei',
#'weight' : 'bold',
#'size' : '12'
}
matplotlib.rc("font",**font)
a=["猩球崛起3:终极之战","敦刻尔克","蜘蛛侠:英雄归来","战狼2"]
b_16=[15746,312,4497,319]
b_15=[12357,156,2045,168]
b_14=[2358,399,2358,362]
p=0.2
x_14=list(range(len(a)))
x_15=[i+p for i in x_14]
x_16=[i+p for i in x_15]
plt.figure(figsize=(20,8),dpi=80)
plt.bar(range(len(a)),b_14,width=0.2,label="9月14日")
plt.bar(x_15,b_15,width=0.2,label="9月15日")
plt.bar(x_16,b_16,width=0.2,label="9月16日")
plt.xticks(x_15,a)
plt.legend()
plt.show()
效果:
绘制直方图:
示例:
from matplotlib.patches import Polygon
import matplotlib.pyplot as plt
import matplotlib
import matplotlib.font_manager as fm
import math
import random
from numpy import dot
#设置中文
font = {'family' : 'MicroSoft YaHei',
#'weight' : 'bold',
#'size' : '12'
}
matplotlib.rc("font",**font)
a=[131, 98, 125, 131, 124, 139, 131, 117, 128, 108, 135, 138, 131, 102, 107, 114, 119, 128, 121, 142, 127, 130, 124, 101, 110, 116, 117, 110, 128, 128, 115, 99, 136, 126, 134, 95, 138, 117, 111,78, 132, 124, 113, 150, 110, 117, 86, 95, 144, 105, 126, 130,126, 130, 126, 116, 123, 106, 112, 138, 123, 86, 101, 99, 136,123, 117, 119, 105, 137, 123, 128, 125, 104, 109, 134, 125, 127,105, 120, 107, 129, 116, 108, 132, 103, 136, 118, 102, 120, 114,105, 115, 132, 145, 119, 121, 112, 139, 125, 138, 109, 132, 134,156, 106, 117, 127, 144, 139, 139, 119, 140, 83, 110, 102,123,107, 143, 115, 136, 118, 139, 123, 112, 118, 125, 109, 119, 133,112, 114, 122, 109, 106, 123, 116, 131, 127, 115, 118, 112, 135,115, 146, 137, 116, 103, 144, 83, 123, 111, 110, 111, 100, 154,136, 100, 118, 119, 133, 134, 106, 129, 126, 110, 111, 109, 141,120, 117, 106, 149, 122, 122, 110, 118, 127, 121, 114, 125, 126,114, 140, 103, 130, 141, 117, 106, 114, 121, 114, 133, 137, 92,121, 112, 146, 97, 137, 105, 98, 117, 112, 81, 97, 139, 113,134, 106, 144, 110, 137, 137, 111, 104, 117, 100, 111, 101, 110,105, 129, 137, 112, 120, 113, 133, 112, 83, 94, 146, 133, 101,131, 116, 111, 84, 137, 115, 122, 106, 144, 109, 123, 116, 111,111, 133, 150]
#计算组数
d=5 #组距
num_bins=int((max(a)-min(a))/d)
plt.figure(figsize=(20,8),dpi=80)
# plt.hist(a,num_bins)
plt.hist(a,range(min(a),max(a)+d,d),density=1)
plt.xticks(range(min(a),max(a)+d)[::d])
plt.grid()
plt.show()
效果图:
条形图绘制成直方图:
from matplotlib.patches import Polygon
import matplotlib.pyplot as plt
import matplotlib
import matplotlib.font_manager as fm
import math
import random
from numpy import dot
#设置中文
font = {'family' : 'MicroSoft YaHei',
#'weight' : 'bold',
#'size' : '12'
}
matplotlib.rc("font",**font)
interval = [0,5,10,15,20,25,30,35,40,45,60,90]
width = [5,5,5,5,5,5,5,5,5,15,30,60]
quantity = [836,2737,3723,3926,3596,1438,3273,642,824,613,215,47]
plt.figure(figsize=(15,6),dpi=100)
plt.bar(interval,quantity,width=width)
sum=0
_x=[]
_x+=[interval[0]-width[0]/2]
interval+=[150]
for i in range(1,len(interval)):
print(interval[i])
print(width[sum])
_x+=[interval[i]-width[sum]/2]
sum+=1
print(_x)
# _x=[i-0.5 for i in interval]
plt.xticks(_x,interval)
plt.grid()
plt.show()