![](https://img-blog.csdnimg.cn/20201014180756925.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
爬虫
songhai210
这个作者很懒,什么都没留下…
展开
-
爬虫第二篇。。。
获取数据: requests,这个库基本就是获取数据最基本的库了,可以说每一个爬虫都在这开始的,书上给出了这个库的get用法,然后就是循环了。 利用get方法,对于静态网页,根据不同的网页变化,在循环中改变URL就可以获取需要的数据了。 r = requests.get(url,headers = headers) 有了这些基本的,基本上大部分网页都可以获取数据了。 获取数据的selenium方法: 利用webdriver类,具体版本变化挺大。 解析数据: from bs4 import Be原创 2020-06-09 10:03:49 · 127 阅读 · 0 评论 -
爬虫学习开篇(Python网络爬虫从入门到实践(第二版))
开启第一篇吧,总是觉得学习是一件反人类的事,要克服原罪的诱惑,还有中年人的借口。 技术,严格来事无聊的人类不得不不断研究提出和改进的东西,就像科学一样,让人困惑。 就像父亲小时候问我,你说什么是数学,什么是化学那,让人无法作答。 而如今我也只比那时的父亲小几岁了,岁月让人变老,但知识还是让我很难回答这问题。 也许是这个问题太大了吧, 但我更觉得是知识太多了, 让人无法说自己真正掌握了。 人类总是喜欢在有限的生命中,了解太多的东西,而现在又处于一个信息大爆炸的时代,所以让我们开始吧。 写.原创 2020-05-28 10:18:41 · 673 阅读 · 0 评论