- 博客(2)
- 资源 (3)
- 收藏
- 关注
原创 爬虫第二篇。。。
获取数据:requests,这个库基本就是获取数据最基本的库了,可以说每一个爬虫都在这开始的,书上给出了这个库的get用法,然后就是循环了。利用get方法,对于静态网页,根据不同的网页变化,在循环中改变URL就可以获取需要的数据了。r = requests.get(url,headers = headers)有了这些基本的,基本上大部分网页都可以获取数据了。获取数据的selenium方法:利用webdriver类,具体版本变化挺大。解析数据:from bs4 import Be
2020-06-09 10:03:49
128
原创 爬虫学习开篇(Python网络爬虫从入门到实践(第二版))
开启第一篇吧,总是觉得学习是一件反人类的事,要克服原罪的诱惑,还有中年人的借口。技术,严格来事无聊的人类不得不不断研究提出和改进的东西,就像科学一样,让人困惑。就像父亲小时候问我,你说什么是数学,什么是化学那,让人无法作答。而如今我也只比那时的父亲小几岁了,岁月让人变老,但知识还是让我很难回答这问题。也许是这个问题太大了吧,但我更觉得是知识太多了,让人无法说自己真正掌握了。人类总是喜欢在有限的生命中,了解太多的东西,而现在又处于一个信息大爆炸的时代,所以让我们开始吧。写.
2020-05-28 10:18:41
678
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人