第三方库

最新推荐文章于 2024-03-16 18:56:34 发布

cuool

最新推荐文章于 2024-03-16 18:56:34 发布

阅读量196

点赞数

文章标签： python

本文链接：https://blog.csdn.net/cuool/article/details/122226933

版权

（1）jieba库：
       jieba.lcut（s）：分割中文词语
   （2）beautifulsoup4库：
       安装：pip install bs4/beautifulsoup4
       常用导入方法：
           导入库：       form bs4 import BeautifulSoup
           创建对象：   soup=BeautifulSoup（文本/网页内容，'html.parser'）
           输出网页代码：   print（soup.prettify（））
   （3）requests库：
       方法：
           r=requests.get.('url'):发送请求获取资源对象，并且返回资源对象
           requests.request(代码标签)：构造请求
           requests.head()：获得网页头信息
       注意：如果访问失败
           r.
       测试步骤：
           import requests:导入库
           r=requests.get('url'):发送并返回请求资源对象
           print(r.status_code)：查看状态码（是否发送成功）
           r.encoding:查看网页编码
           r.apparent_encoding:根据网页内容评估的备用编码
           r.text:查看整个网页内容
           r.encoding=r.apparent_encoding:将备用编码替换头编码
           r.text[-500:]
           r.text[:1000]

           from bs4 import BeautifulSoup
           demo=r.text
           soup=BeautifulSoup（文本/网页内容，‘html.parser’）
           print(soup.prettify())

cuool

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
第三方库

（1）jieba库： jieba.lcut（s）：分割中文词语（2）beautifulsoup4库：安装：pip install bs4/beautifulsoup4 常用导入方法：导入库： form bs4 import BeautifulSoup 创建对象： soup=BeautifulSoup（文本/网页内容，'html.parser'）输出...
复制链接

扫一扫

第三方库

“相关推荐”对你有帮助么？