自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(3)
  • 收藏
  • 关注

原创 手机壁纸-crawlspider-图片管道存储

手机壁纸-crawlspider-图片管道存储目标url:https://www.3gbizhi.com/sjbz/index_1.html分析:- 使用crawlspider创建工程文件- 使用链接提取器提取单页所有的图片的url- LinkExtractor(restrict_xpaths=’/html/body/div/ul/li/a’)- 这里使用了xpath语法,在Crawlspider使用xpath时只需要指定url所对应的父节点即可- 使用链接提取器实现翻页- link_nex

2021-08-04 14:03:10 148

原创 字体反爬-起点月票

字体反爬-起点月票思路分析1、得到该页面的所有月票数据2、对月票url 发送请求 获取响应3、提取字体文件的url,通过该url提取字体的关系映射表4、保存数据“”"import reimport requestsfrom fontTools.ttLib import TTFontfrom io import BytesIOfrom lxml import etree代码实现:1、确定urlbase_url = 'https://www.qidian.com/rank/yuepi

2021-05-23 02:37:04 772

原创 python小炮灰爬取视频-----初学着勿喷---关键在于获取每个视频的URL ---- json文件

### 爬取某 B_ 视频 import requestsfrom lxml import etreeimport json,timefrom jsonpath import jsonpathfrom moviepy.editor import *from threading import Thread# https://api.bilibili.com/x/web-interface/newlist?rid=138&type=0&pn=2&ps=20&a...

2021-05-04 22:34:43 139

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除