老司机要开车了!用Selenium+PhantomJS来抓取煎蛋网妹子图

0d6a376a1d6903b1b08301f6ec66ad5bx640x800x56.jpeg;,3,jpegx;3,700x.jpg

那天有朋友找我一起抓妹子图片,像我这么正派的人,肯定是要抱着学习的目的......打开网页,哇!又...又要上火了。。。。

e8753c95ce2807dc8fa4ec6d61e144e2x550x318x16.jpeg;,3,jpegx;3,700x.jpg

话不多说,先看看网页吧!

3d5f75c1f8151efe103b3755b24cdda5x550x284x28.jpeg;,3,jpegx;3,700x.jpg

熟练的打开网页,找到妹子图,然后F12打开开发者工具,定位,ok,图片地址找到了,so easy~!,我们写入代码看看

7e60aea22bf7662e840c24d2d400e3c8x548x194x15.jpeg;,3,jpegx;3,700x.jpg

WTF~!

返回了个空列表?加了header也是这样,为啥呢,来打开源码看看

1df2ae78bb9be95000b545132809b492x1214x101x37.jpeg;,3,jpegx;3,700x.jpg

原来是js数据,这就麻烦了,难道先去学习下js语法,拿js文件,分析逻辑,找最终的url吗?

62752c724b22c4b2543a52a67cd14705x555x291x12.jpeg;,3,jpegx;3,700x.jpg

​让我们用selenium+PhantomJS试试吧!

安装请自行百度(有些麻烦,需要下载各种浏览器的相关驱动文件,网上一堆教程)

我们先获取源码后找找刚才的标签看看效果!

57367315a92cbd87cd8931ef383b1ee9x958x84x24.jpeg;,3,jpegx;3,700x.jpg

​吼吼~乖乖的出现了吧!

下面的流程就简单了,找到URL中翻页按钮,循环它,直到没有为止!然后写个获取图片并下载的函数,不到40行代码搞定!剩下的就是静静等待了!

da3dda3d26ce9d2908c4463c1828200dx534x361x12.jpeg;,3,jpegx;3,700x.jpg

完整代码和下载效果如下:

bdbf7e9a381fee33ff8b46374a6b803dx545x532x34.jpeg;,3,jpegx;3,700x.jpg

0dcfbfd0f357ad0ef07b67bf0936d835x785x395x22.jpeg;,3,jpegx;3,700x.jpg

5ead276f5ccf40756984be8c0dc51223x1032x607x178.jpeg;,3,jpegx;3,700x.jpg

c45c56dba744fd5f9836ede8cd817e5dx486x321x13.jpeg;,3,jpegx;3,700x.jpg

转载于:https://my.oschina.net/u/3873244/blog/1823293

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值