- 博客(3)
- 收藏
- 关注
原创 手机壁纸-crawlspider-图片管道存储
手机壁纸-crawlspider-图片管道存储 目标url:https://www.3gbizhi.com/sjbz/index_1.html 分析: - 使用crawlspider创建工程文件 - 使用链接提取器提取单页所有的图片的url - LinkExtractor(restrict_xpaths=’/html/body/div/ul/li/a’) - 这里使用了xpath语法,在Crawlspider使用xpath时只需要指定url所对应的父节点即可 - 使用链接提取器实现翻页 - link_nex
2021-08-04 14:03:10 155
原创 字体反爬-起点月票
字体反爬-起点月票 思路分析 1、得到该页面的所有月票数据 2、对月票url 发送请求 获取响应 3、提取字体文件的url,通过该url提取字体的关系映射表 4、保存数据 “”" import re import requests from fontTools.ttLib import TTFont from io import BytesIO from lxml import etree 代码实现: 1、确定url base_url = 'https://www.qidian.com/rank/yuepi
2021-05-23 02:37:04 782
原创 python小炮灰爬取视频-----初学着勿喷---关键在于获取每个视频的URL ---- json文件
### 爬取某 B_ 视频 import requests from lxml import etree import json,time from jsonpath import jsonpath from moviepy.editor import * from threading import Thread # https://api.bilibili.com/x/web-interface/newlist?rid=138&type=0&pn=2&ps=20&a...
2021-05-04 22:34:43 146
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人