![](https://img-blog.csdnimg.cn/20201014180756916.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
python爬虫
文章平均质量分 79
静水流深~
静水流深
展开
-
python爬虫(1)-使用requests和beautifulsoup库爬取中国天气网
python爬虫(1)-使用requests和beautifulsoup库爬取中国天气网使用工具及准备python3.7(python3以上都可以)pycharm IDE (本人习惯使用pycharm,也可以使用其他的)URL: http://www.weather.com.cn/weather/101230101.shtmlbeautifulsoup4、requests、lxml库(p...原创 2019-03-29 15:00:55 · 7042 阅读 · 0 评论 -
python爬虫利器之正则表达式的详解
正则表达式正则表达式是什么正则表达式是对字符串操作的一种逻辑公式,就是用事先定义好的一些特定字符、及这些特定字符的组合,组成一个“规则字符串”,这个“规则字符串”用来表达对字符串的一种过滤逻辑。正则表达式通常被用来检索、替换那些匹配某个模式的文本。来点通俗易懂的,比如如下一个字符串:data = '他的电话号码是:123456789'从这里取出数字的这一本分就可以用正则来完成,利用他自...原创 2019-03-30 14:09:09 · 552 阅读 · 0 评论 -
python爬虫(2)- 爬取今日头条街拍美图
前言有时候用requests抓取页面数据时,可能会和我们想要的不一样,也就是不会出现我们想要的数据,浏览器中可以看到,但是requests的结果没有这些数据,这是为什么呢?因为requests得到的是原始的文档,而真正的网页是经过JavaScript渲染得到的,这些数据可能是通过Ajax加载的,也可能是经过JavaScript加密的。对于Ajax加载,其实是一种异步加载方式,原始页面加载完成后...原创 2019-04-01 16:06:09 · 2676 阅读 · 0 评论