自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(7)
  • 收藏
  • 关注

原创 fiddler 抓包工具

直接在 软件管理里下载fiddler就Ok 了 fiddler 1,配置 tools==>options==>https 选中:capture https decrypt https trafic ignor xxx 点击右边的action,信任根证书 配置完毕,关闭重启 2,<>:html内容 一个本子加一个→:pos...

2020-02-13 23:11:39 90

原创 正则表达式详解实用-深入

import re ''' 字符串切割 ''' str1 = "tom is a good man" print(re.split(r' +',str1))#至少一个空格作为切割 ''' re.finditer函数 与findall类似,扫描整个字符串,返回的是一个迭代器next()返回一个对象 ''' str2 = "tom is a good man! t...

2020-02-13 23:08:54 98

原创 正则表达式详解实用-基础

import re ''' re.match(pattern,string,flags=0) pattern:子串 string:父串 flags:标志位,用于控制正则表达式的匹配方式,值如下 re.I 忽略大小写 re.M 多行匹配,影响^和$ re.S 是.匹配包括 换行 符再内的所有字符 功能:尝试从字符串的 起始位置 匹配一个模式, 如果不是起始位置匹配成功的话,返...

2020-02-13 23:08:04 80

原创 正则表达式详解实用-元字符

import re r''' 匹配单个字符与数字 . 匹配除换行符以外的任意字符 [0-9] []字符集合,表示匹配[]所包含的任意一个字符 [0-9a-zA-Z_] 匹配字母数字下划线 [^To] 匹配除了To这两个字母外的所有字符 ^在[]里为脱字符 表示不匹配集合中的字符 \d 匹配数字,效果同[0-9] \D 匹配非数字字符 \w 匹配数字字母下划...

2020-02-13 23:07:03 115

原创 关于爬虫的Error:URLError,HTTPError

作者学的课程:https://www.bilibili.com/video/av33963847 import urllib.request import urllib.parse import urllib.error ''' URLError: 1.没有网 2.服务器连接失败 3.找不到指定的服务器 HTTPError: 是URLError的子类 ''' url = 'htt...

2020-02-13 23:05:07 283

原创 ajax 爬取豆瓣(get),肯德基(post),贴吧(复杂的get)

已分类好,大家可放心调用代码,虽然很简单,但是理解原理就好了 作者看的课程:https://www.bilibili.com/video/av33963847 import urllib.request import urllib.parse import os ''' ajax get例子:豆瓣 url = 'https://movie.douban.com/j/chart/top_lis...

2020-02-13 23:03:09 108

原创 xpath用法(非常实用)和示例

安装 cmd 里 pip install lxml 导入 from lxml import etree 作者学爬虫的课:https://www.bilibili.com/video/av33963847,不是广告,老师讲的特别好 ''' 再x-path中,有3种主要类型的节点:元素,属性,文本 常用的路径表达式: //:不考虑位置的查找 ./:从当前节点开始往下查找 ..:从当前节点的父节点...

2020-02-13 22:59:51 785

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除