爬虫
文章平均质量分 74
嗨嗨嗨2232
这个作者很懒,什么都没留下…
展开
-
urllib/request
urllib urllib是标准库, 死一个工具包模块包括以下模块: urllib.request 用于打开和读取url urllib.error 包含了由于urllib.request引起的异常 urllib.parse 用于解析url urllib.robotparser 分析robots.txt文件 urllib.request模块 模块定义了在基本和摘要式身份验证, 重定向, cook...原创 2019-08-30 23:06:14 · 155 阅读 · 0 评论 -
lxml,BeautifulSoup4
BeautifulSoup4** 安装 $pip install beautifulsoup4 初始化 BeautifulSoup(markup="", features=None) **markup:**被解析对象, 文件对象或者html字符串 **features:**解析器, 返回一个文档对象 from bs4 import BeautifulSoup ...原创 2019-09-01 22:19:49 · 174 阅读 · 0 评论