No.1 Class notes
※第三方库:
(1)jieba库:
jieba.lcut(s):分割中文词语
(2)beautifulsoup4库:
安装:pip install bs4/beautifulsoup4
常用导入方法:
导入库:from bs4 import BeautifulSoup
创建对象:soup=BeautifulSoup(文本/网页内容,'html.parser')
输出网页代码:print(soup.prettify())
(3)requests库:
方法:
r=requests.get('url')发送请求获取资源对象,并且返回资源对象
requests.request(代码标签):构造请求
requests.head():获取网页头信息
注意:如果访问失败
r.ques
测试步骤:
import requests:导入库
r=requests.get('url'):发送并返回请求资源对象
print(r.status_code):查看状态码(是否发送成功)
r.encoding:查看网页编码
r.apparent_encoding:根据网页内容评估的备用编码
r.text:查看整个网页内容
r.encoding=r.apparent_encoding:将备用编码替换头编码
r.text[-500:]
r.text[:1000]
from bs4 import BeautifulSoup
'''
demo=r.text
soup=BeautifulSoup(demo,'html.parser')
'''
soup=BeautifulSoup(文本/网页内容,'html.parser')
print(soup.prettify())
※科学计算和可视化:
(1)科学计算库:
安装:pip install numpy
导入:import numpy as np
(2)绘制图形:
安装:pip install matplotlib
导入:import matplotlib.pyplot as plt
No.2 Infratest
#1.matplotlib小测试
'''
import matplotlib.pyplot as plt #导入绘图第三方库
plt.plot([4,1,5,3,2],[1,4,-2,3,0],[2,3,4,1,-2]) #给图形拐点坐标赋值,并绘制2D图形
plt.savefig('test1',dpi=600) #存储图形文件
plt.savefig('../picture/test1',dpi=600)
plt.axis(['0,6,-8,8']) #表示坐标轴上的极限点
plt.show() #展示图形内容
'''
#2.matplotlib综合测试
'''
import matplotlib.pyplot as plt #导入绘图第三方库
plt.plot([4,1,5,3,2],[1,4,-2,3,0],[2,3,4,1,-2]) #给图形拐点坐标赋值,并绘制2D图形
plt.xlabel('Grade')
plt.ylabel('Course')
plt.savefig('test2',dpi=600) #存储图形文件
plt.savefig('../picture/test2',dpi=600)
plt.axis(['equal']) #表示坐标轴上的极限点
plt.show() #展示图形内容
'''
#3.同一绘图区域绘制多图
'''
import numpy as np #导入科学计算库
import matplotlib.pyplot as plt
a=np.arange(5)
plt.plot(a,a+4.5,'ro-',label='a')
plt.plot(a,a*-3.5,'gx:',label='b')
plt.plot(a,a**2,'y*-',label='c')
plt.plot(a,a-4.5,'bs-.',label='d')
plt.plot([1,4,5,3],'mp-',label='e')
plt.savefig('test3',dpi=600)
plt.savefig('../picture/test3',dpi=600)
plt.legend()
plt.show()
'''
#4.多区域绘图
'''
import numpy as np
import matplotlib.pyplot as plt
def f(t):
return np.exp(-t)*np.cos(2*np.pi*t)
a=np.arange(0,5,0.02)
plt.subplot(322)
plt.plot(a,f(a))
plt.subplot(323)
plt.plot(a,np.cos(2*np.pi*a),'-.',color='r')
plt.subplot(324)
plt.plot(a,np.sin(2*np.pi*a),'--',color='g')
plt.subplot(325)
plt.plot(a,np.tan(2*np.pi*a),':',color='m')
plt.savefig('test4',dpi=600)
plt.savefig('../picture/test4',dpi=600)
plt.show()
'''
#5.饼图绘制
'''
import matplotlib.pyplot as plt
labels='Frogs','Hogs','Dogs','Logs'
sizes=[15,30,45,10]
explode=(0,0.1,0,0)
plt.pie(sizes,explode,labels,autopct='%1.1f%%',shadow=True,startangle=90)
plt.axis('equal')
plt.savefig('test5',dpi=70)
plt.savefig('../picture/test5',dpi=70)
plt.show()
'''
#6.条形图的绘制
'''
import numpy as np
import matplotlib.pyplot as plt
datearr=['2018Y','2019Y','2020Y','2021Y']
num_masks=np.asarray([45.4,50,62.2,77])
plt.bar(datearr,num_masks,width=0.3)
plt.xlabel('2018年--2021年',fontproperties='SimHei',fontsize=10)
plt.ylabel('数量/亿只',fontproperties='SimHei',fontsize=10)
plt.title('2018年—2021年中国大陆地区口罩生产量',fontproperties='SimHei',fontsize=10)
plt.savefig('test6',dpi=600)
plt.savefig('../picture/test6',dpi=600)
plt.show()
'''
No.3 Laboratory finding
(内容过多,无法展示)