![](https://img-blog.csdnimg.cn/20201014180756926.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
爬虫
knock_me
这个作者很懒,什么都没留下…
展开
-
爬虫入门(2)——BeautifulSoup库
BeautifulSoup拓展包安装 pip3 install BeautifulSoup4 --default-timeout=1000 BeautifulSoup简介 BeautifulSoup是一个html/xml的解析器,主要功能是解析和提取html/xml中的数据。 BeautifulSoup支持python标准库中的html解析器,也支持一些第三方的解析器。如果我们没有进行额外的安装,使用的就是python默认是解析器。lxml解析器更加强大,速度更快,推荐使用lxml。 1、提取网页中的纯原创 2020-09-09 00:36:43 · 324 阅读 · 0 评论 -
爬虫入门(1)——requests库
一、requests拓展包的安装 1、直接在终端执行下面命令,报错。 pip3 install requests 2、查看报错原因,里面有一句。估计是网络问题。 raise ReadTimeoutError(self._pool, None, 'Read timed out.') 3、在命令中增加响应时长后执行成功。 pip3 install requests --default-timeout=1000 # 运行结果 Successfully installed certifi-2020.6.20 c原创 2020-09-09 00:33:23 · 244 阅读 · 0 评论