(1)turtle库:
(2)random库:
(3)math库:
(4)os库:
os.path.abspath('路径'):显示当前路径操作文件的绝对路径
os.system('路径'):显示或打开文件(进程)
(5)re库:正则表达式库
(6)string库:字符串常量库
方法
12.24
27.第三方库
(1)jieba库:
jieba.lcut(s):分割
(3) requests库:
安装: pip install requests
r=requests. get( ul' ):发送请求获取资源对象,并且返回资源对象
requests. request (代码标签) :构造请求
requests. head() :获取网页头信息
注意:如果访向失败
r. ruqeust. headers:查找本网页的用户代理
网络爬虫步骤
import requests:导入库
r=requests.get('url'):发送并返回请求资源对象
r.encoding:查看网页编码
r.apparent_encoding :根据网页内容评估的备用编码
r.text:查看整个网页内容
r.encoding=r.apparent_encoding :将备用编码替换头编码
r.text[-500:]
r.text[:1000]
from bs4 import BeautifulSoup
demo=textl:[1000]
soup=BeautifulSoup(文本/网页内容,'html.parser')
print(soup.prettify())
科学计算和可视化
(1)科学计库:
安装:pip install numpy
导入:import numpy as np
(2)绘制图形库:
安装: pip install matplotlib
导入: import matplotlib.pyplot as plt