splash爬虫

# -*- coding: utf-8 -*-
import scrapy
import sys
from scrapy_splash import SplashRequest
from android.agents import agents
reload(sys)
sys.setdefaultencoding('utf-8')
class AndroidSpider(BaseSpider):
    name = "android"
    start_url="http://www.wandoujia.com/top/app"
    def start_requests(self):
        script = """
        function main(splash)
            assert(splash:go(splash.args.url))
            for var=0,50,1 do
                local get_dimensions = splash:jsfunc([[
                function () {
                var rect = document.getElementById('j-refresh-btn').getClientRects()[0];
                return {"x": rect.left, "y": rect.top}
                }
                ]])
                splash:set_viewport_full()
                splash:wait(0.1)
                local dimensions = get_dimensions()         
                splash:mouse_click(dimensions.x, dimensions.y)
                -- Wait split second to allow event to propagate.
                splash:wait(0.5)
            end
            return  splash:html()
            end
        """
        agent = random.choice(agents)
        print "------cookie---------"
        headers={
            "User-Agent":agent,
            "Referer":"xxxxxxx",
        }
        splash_args = {
            'wait': 3,
            "http_method":"GET",
            # "images":0,
            "timeout":1800,
            "render_all":1,
            "headers":headers,
            'lua_source': script,
            #"cookies":cookies
            # "proxy":"http://101.200.153.236:8123",
        }
        yield SplashRequest(AndroidSpider.start_url, self.parse_result, endpoint='execute',args=splash_args,dont_filter=True)
        # +"&page="+str(x+1)
        except Exception, e:
        print e.__doc__
        print e.message
        pass
    def parse_result(self):
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值