爬虫初学2

采用requests和parsel爬取美女图片

#parsel 主要用来将请求后的字符串格式解析成re,xpath,css进行内容的匹配    本代码采用xpath
#爬虫初学2 "设置请求头" "运用parsel"进行爬取美女图片
import requests
import parsel
for page in range(1,6): #打印多页,添加的第一行
    print('================正在抓取第{}页数据===================='.format(page))    #添加第二行
    '''#确定爬取的网址(可见及可爬),找到headers和设置headers。'''
    url='http://www.win4000.com/mobile_2340_0_0_{}.html'.format(str(page))   #修改的第三行     #如果换成http://www.win4000.com/meinvtag4_1.html,则for中xpath定位不到相应图片src,有点瑕疵
    #头3 可用
    headers={'Accept':'text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,*/*;q=0.8',
             'Connection':'keep-alive',
             'Host':'www.win4000.com',
      
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值