python学习笔记(数据分析2)

一、常用统计图

1、绘制散点图

from matplotlib import pyplot as plt
from matplotlib import font_manager

y_3 = [11,17,23,34,23,12,4,32,5,24,6,5,23,35,33,12]
y_10= [23,24,12,23,1,4,16,32,1,3,12,23,43,24,23,23]

x_3=range(1,32)
x_10=range(51,82)
# 设置图形大小
plt.figure(figsize=(20,8),dpi=80)

plt.scatter(x_3,y_3)
plt.scatter(x_10,y_10)

plt.show()

 

2、绘制条形图

# 绘制横着的条形图
from matplotlib import pyplot as plt
from matplotlib import font_manager
my_font=font_manager.FontProperties(fname="/System/Library/Fonts/Hiragino Sans GB.ttc")
a=['A','B','C','D','E']
b=[56.01,26.94,17.53,16.49,15.45]
# 设置图形大小
plt.figure(figsize=(20,7),dpi=80)
# 条形图
plt.barh(range(len(a)),b,henghto=0.3,color="orange")
# 设置字符串到x轴
plt.xticks(range(len(a)),a, fontproperties=my_font, rotation=90)
plt.grid(alpha=0.3)
plt.savefig("./movie.png") 
plt.show()

应用场景:不同条件维度之间的内在关联关系、观察数据的离散聚合程度 

3、绘制多次条形图

from matplotlib import pyplot as plt
from matplotlib import font_manager

font = font_manager.FontProperties(fname=  )

a = ["A","B","C","D"]

b_16 = [15746,312,4997,319]
b_15 = [12357,156,2045,168]
b_14 = [2358,399,2358,362]

bar_width=0.2

#重点,x轴右移
x_14 = list(range(len(a)))
x_15 = [i+bar_width for i in x_14]
x_16 = [i+bar_width*2 for i in x_14]
#设置图形大小像素
plt.figure(figsize=(10,5))

# 绘制条形图
plt.bar(range(len(a)),b_14,width=bar_width,label="14日")
plt.bar(x_15, b_15,  width=bar_width,label="15日")
plt.bar(x_16, b_16,  width=bar_width,label="16日")
#设置x轴刻度
plt.xticks(x_15,a,fontproperties="KaiTi")
#设置图例
plt.legend(prop=font)
plt.xlabel("a",fontproperties="KaiTi",size=20)
plt.ylabel("b", fontproperties="KaiTi", size=20)
plt.title("c", fontproperties="KaiTi", size=30)
plt.show()

应用场景:数量统计,频率统计(市场饱和度) 

4、绘制直方图

from matplotlib import pyplot as plt
from matplotlib import font_manager

interval=[0,5,10,15,20,25,30,35,40,45,60,90]
width=[5,5,5,5,5,5,5,5,5,15,30,60]
quantity=[836,2737,3723,3480,2489,2424,3543,2314,1234,3324,2131,2346]

print(len(interval),len(width),len(quantity))

# 设置图形大小
plt.figure(figsize=(20,8),dpi=80)

plt.bar(range(12),quantity,width=1)

# 设置x轴
_x=[i-0.5 for i in range(13)]
_xtick_labels=interval+[150]
plt.xticks(_x,_xtick_labels)

plt.grid(alpha=0.4)
plt.show()

运用场景:用户的年龄分布状态,一段时间内用户点击次数的分布状态,用户活跃时间的分布状态

一般来说能够使用plt.hist方法的是那些没有统计过的数据

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值