2018年07月_fengxueersui

08月 07月 06月 05月 04月 02月

转载 Scrapy学习笔记-使用signals来监控spider的状态

有时候我们需要在spider启动或者结束的时候执行一些特定的操作，比如说记录日志之类的，在scrapy中我们可以使用signals来实现。主要实现代码如下：# -*- coding: utf-8 -*-from scrapy import signalsfrom scrapy.xlib.pydispatch import dispatcherfrom scrapy.linkextractor...

2018-07-05 17:37:49 2902

转载 Python 实现京东自动登录领京豆

今天带大家进行模拟京东登录，并进行签到获取京豆，1000 个京豆 = 10 元，是不是一个发现了一个「发家致富」的好路子？废话不多说，下面开始正题。整体流程如下：1 模拟登录首先我们需要的就是模拟京东登录，只有登录了才能进行签到领京豆等操作。模拟登录其实就是通过 HTTP 的 POST 请求讲用户的登录信息发送给服务器进行认证的过程。1.1 登录数据分析登录过程表面上看着挺简单，我们只要在浏览器里...

2018-07-05 14:48:05 5184

转载 python scrapy+Mongodb爬取蜻蜓FM，酷我及懒人听书

1、初衷：想在网上批量下载点听书、脱口秀之类，资源匮乏，大家可以一试2、技术：wireshark scrapy jsonMonogoDB3、思路：wireshark分析移动APP返回的各种连接分类、列表、下载地址等（json格式）4、思路：scrapy解析json，并生成下载连接5、思路：存储到MongoDB6、难点：wireshark分析各类地址，都是简单的scrapy的基础使用，官网的说明文档...

2018-07-04 19:55:49 1829

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人