标准库:
(1)turtle库:
(2)random库:
(3)os库:
(4)re库:
(5)string库:字符串常量库
(6)math库:
第三方库:
(1)wordcloud库
(2)jieba库
(3)imageio库
(4)matplotlib库
(5)requests库
第三方库
(1)jieba库:
jieba.lcut(s):分割中文词语
(2)beuatifulsoup4库:
安装:pip install bs4/beautifulsoup4
常用导入方法:
导入库:from bs4 import BeautifulSoup
创建对象: soup=BeautifulSoup(文本、网页内容,‘html.parser’)
输出网页代码:print(soup.prettify())
(3)requests库:
方法:
r=requests.get('url'):发送请求获取资源对象,并且返回资源对象
requests.requset(代码标签):构造请求
requests.head():获取网页头信息
注意:如果访问失败
测试步骤:
import requests:导入库
r=requests.get('url':)发送请求获取资源对象,并且返回资源对象
print
r.encoding
r.apparent_encoding
r.text
r.encoding=r.apparent_encoding
r.text[-500:]
r.text[-1000:]