#绘制折线图/散点图plot
import matplotlib.pylab as pyl #导入可视化模块
import numpy as npy #导入数组模块
pyl.rcParams['font.sans-serif']=['SimHei'] # 用来正常显示中文标签
pyl.rcParams['axes.unicode_minus']=False # 用来正常显示负号
x=[1,2,3,4,8]
y=[5,7,2,1,5]
#pyl.plot(x,y) #plot(x轴,y轴,展现形式) 默认折线图
#pyl.show()
#pyl.plot(x,y,'o') #散点图
#pyl.show()
#pyl.plot(x,y,'oc') #青色的散点图
#pyl.show()
'''
c 青色、r 红色、m 品红、g 绿色、b 蓝色、y 黄色、k 黑色、w 白色
'''
#如果图层未取消则重叠展现
#线条样式
#pyl.plot(x,y,'--oc') #青色散点虚线
#pyl.show()
'''
- 直线
-- 虚线
-. -.的形式
: 细小的虚线
'''
#点的样式(默认散点图)
#pyl.plot(x,y,'*') #星形散点
#pyl.show()
'''
s 方形
h /H 六角形
* 星行
+ 加号
x x型
d/D 棱形
p 五角形
'''
pyl.plot(x,y) #初始x,y
x2=[1,3,5,6,8,10,12,19]
y2=[1,6,9,10,12,19,23,25]
pyl.plot(x2,y2,'oc')
pyl.plot(x,y,'*r')
pyl.title("趋势图") #表名
pyl.xlabel("年龄") #横轴名称
pyl.ylabel("脾气") #纵轴名称
pyl.xlim(0,20) #x轴范围
pyl.ylim(1,40) #y轴范围
pyl.show()
#随机数的生成
data=npy.random.random_integers(1,20,10)#(min,max,个数)
print(data)
#生成具有正太分布的随机数
data2=npy.random.normal(5.0,2.0,10)#(均值,西格玛(标准差),个数)
print(data2)
#更多随机数生成知识:http://www.mamicode.com/info-detail-507676.html
#直方图hist
data3=npy.random.normal(10.0,1.0,10000)
#pyl.hist(data3)
#pyl.show()
data4=npy.random.random_integers(1,25,1000) #(min,max,个数)
#pyl.hist(data4)
sty=npy.arange(2,25,2) #(min,max,步长)设置直方图宽度、上下限
pyl.hist(data4,sty,histtype='stepfilled') #取消轮廓:histtype='stepfilled'
pyl.show()
#绘制子图
pyl.subplot(2,2,1) #(2行,2列,当前区域1)
x1=[1,2,3,4,5]
y1=[5,3,5,7,9]
pyl.title("111")
pyl.plot(x1,y1,'c')
pyl.subplot(2,2,2) #(2行,2列,当前区域2)
x1=[6,2,13,4,15]
y1=[15,13,35,7,9]
pyl.title("222")
pyl.plot(x1,y1,'r')
pyl.subplot(2,1,2) #(2行,1列,当前区域2)
x1=[11,21,31,4,5]
y1=[15,31,5,7,19]
pyl.title("333")
pyl.plot(x1,y1,'*')
pyl.show()
#读取csv格式的数据并可视化分析
import pandas as pda
import numpy as npy
import matplotlib.pylab as pyl
pyl.rcParams['font.sans-serif']=['SimHei'] # 用来正常显示中文标签
pyl.rcParams['axes.unicode_minus']=False # 用来正常显示负号
data=pda.read_csv("E:\python数据分析与挖掘\源码\源码\第5周\hexun.csv")
data.shape #行、列信息
data.values[1][2] #[行][列] 第二行第三列
data2=data.T #转置
x1=data2.values[3] #评论数
y1=data2.values[4] #阅读量
pyl.plot(x1,y1,'.')
pyl.title("阅读与点击量")
pyl.xlabel("评论数")
pyl.ylabel("阅读量")
pyl.show()
#文章ID和阅读数的集中趋势
x2=data2.values[0]
pyl.plot(x2,y1)
pyl.show()
pyl.title("阅读与ID")
pyl.xlabel("ID")
pyl.ylabel("阅读量")
pyl.show()