2021年04月_Ronin__L

原创 scrapy模块01

一、scrapy的概念和流程1. scrapy的概念Scrapy是一个Python编写的开源网络爬虫框架。它是一个被设计用于爬取网络数据、提取结构性数据的框架。Scrapy 使用了Twisted['twɪstɪd]异步网络框架，可以加快我们的下载速度。Scrapy文档地址：http://scrapy-chs.readthedocs.io/zh_CN/1.0/intro/overview.html2. scrapy框架的作用少量的代码，就能够快速的抓取3. scrapy的工作流程

2021-04-18 14:22:31 255

原创 jsonpath模块

jsonpath模块文章目录jsonpath模块一、jsonpath模块的使用场景二、 jsonpath模块的使用方法1、 jsonpath模块的安装2、 jsonpath模块提取数据的方法3、 jsonpath语法规则4、 jsonpath练习1、示例1如下：2、示例2如下：3、示例3如下：一、jsonpath模块的使用场景如果有一个多层嵌套的复杂字典，想要根据key和下标来批量提取value，这是比较困难的。jsonpath模块就能解决这个痛点jsonpath可以按照key对python字典进

2021-04-14 11:03:59 328 1

原创数据提取

数据提取文章目录数据提取一、响应内容的分类1、结构化的响应内容1.1、 json字符串1.2 xml字符串2、非结构化的响应内容二、认识xml以及和html的区别1、认识xml2、xml和html的区别二、常用数据解析方法一、响应内容的分类在发送请求获取响应之后，可能存在多种不同类型的响应内容；而且很多时候，我们只需要响应内容中的一部分数据1、结构化的响应内容1.1、 json字符串可以使用re、json等模块来提取特定数据1.2 xml字符串- 可以使用re、lxml等模

2021-04-14 09:08:13 197

原创 requests模块02

requests模块02文章目录requests模块02一、发送带请求头的请求1、查看网页源码的方法:2、查看对应urI的响应内容的方法:3、携带请求头发送请求的方法二、发送带参数的请求1、查询字符串2、在url携带参数3、通过params携带参数字典三、在headers参数中携带cookie1、github登陆抓包分析2、完成代码3、cookies参数的使用3.1 cookies参数的形式:字典3.2 cookies参数的使用方法3.3 将cookie字符串转换为cookies参数所需的字典:3.4

2021-04-13 14:41:53 134

Ronin__L的博客

原创 scrapy模块01

原创 jsonpath模块

原创数据提取

原创 requests模块02

原创 requests模块01

原创爬虫基础02

原创爬虫基础01

原创爬虫基础03

原创前端（后端）概述

原创 JAVA12

原创 JAVA11

原创 JAVA10

空空如也

空空如也