python爬虫
文章平均质量分 86
xlelou
话唠
展开
-
使用python3 爬取豆瓣电影热映和即将上映
使用python3爬取都摆即将上映和正在热映的电影,代码如下直接使用bs4获取页面,使用css 获取到对应的信息后,使用字符串拼接的方式,将正在热映和即将上映的信息拼接出来并写入到html页面中,在爬取完毕后打开生成的html。内容比较简单[码云的地址](https://gitee.com/xlelou/spider/blob/master/doubai.py)其他地址,我的小社区import r...原创 2018-06-25 17:31:08 · 1377 阅读 · 0 评论 -
python爬虫,使用urllib + 正则
学习使用urllib + 正则爬取熊猫TV的直播,获取直播人和直播人气,并且进行了排序from urllib import requestimport reclass Spider(): url = 'https://www.panda.tv/cate/dota2' root_pattern = r'<div class="video-info">([\s\S...原创 2018-08-24 23:15:30 · 208 阅读 · 0 评论