python爬虫
文章平均质量分 67
HSBhuang
这个作者很懒,什么都没留下…
展开
-
Pyhton爬取TIOBE编程语言信息
简介百度百科TIOBE排行榜是根据互联网上有经验的程序员、课程和第三方厂商的数量,并使用搜索引擎(如Google、Bing、Yahoo!)以及Wikipedia、Amazon、YouTube统计出排名数据,只是反映某个编程语言的热门程度,并不能说明一门编程语言好不好,或者一门语言所编写的代码数量多少。了解了什么是TIOBE,接下来让我们爬取一下TIOBE里面的编程语言排行榜的信息。爬取过程1、打开TIOBE官网https://www.tiobe.com/tiobe-index/,检查分析页面信息原创 2021-05-07 16:14:01 · 741 阅读 · 1 评论 -
Python爬取图片(requests和re两个模块实现)
以爬取新浪图片网站为例,用requests和re这两个库来实现目的。网站:http://photo.sina.com.cn/newyouth/下面为代码实现的过程:1、打开url的函数:open_url(url)def open_url(url): headers = {'User-Agent':'Mozilla/5.0 (Linux; Android 6.0; Nexus 5 B...原创 2019-07-19 10:24:27 · 1561 阅读 · 0 评论 -
Python爬取煎蛋网多页的图片
使用requests和re模块来实现目的以爬取煎蛋网里面的随手拍的图片为例网址:http://jandan.net/ooxx爬取一页的图片相对比较简单,直接使用这个网址,对里面的源代码进行分析和检索,使用re模块里面的正则表达式进行对目标图片的链接进行提取,这样就可以把单页的图片下载并保存起来。如果要爬取多页的图片的话,这要在原来的基础上进行一个for each in range(page...原创 2019-07-20 12:54:32 · 472 阅读 · 0 评论