TecFy-CSDN博客

原创手机壁纸-crawlspider-图片管道存储

手机壁纸-crawlspider-图片管道存储目标url：https://www.3gbizhi.com/sjbz/index_1.html 分析： - 使用crawlspider创建工程文件 - 使用链接提取器提取单页所有的图片的url - LinkExtractor(restrict_xpaths=’/html/body/div/ul/li/a’) - 这里使用了xpath语法，在Crawlspider使用xpath时只需要指定url所对应的父节点即可 - 使用链接提取器实现翻页 - link_nex

2021-08-04 14:03:10 155

原创字体反爬-起点月票

字体反爬-起点月票思路分析 1、得到该页面的所有月票数据 2、对月票url 发送请求获取响应 3、提取字体文件的url，通过该url提取字体的关系映射表 4、保存数据 “”" import re import requests from fontTools.ttLib import TTFont from io import BytesIO from lxml import etree 代码实现： 1、确定url base_url = 'https://www.qidian.com/rank/yuepi

2021-05-23 02:37:04 782

原创 python小炮灰爬取视频-----初学着勿喷---关键在于获取每个视频的URL ---- json文件

### 爬取某 B_ 视频 import requests from lxml import etree import json,time from jsonpath import jsonpath from moviepy.editor import * from threading import Thread # https://api.bilibili.com/x/web-interface/newlist?rid=138&type=0&pn=2&ps=20&a...

2021-05-04 22:34:43 146

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

原创 手机壁纸-crawlspider-图片管道存储

原创 字体反爬-起点月票

原创 python小炮灰爬取视频-----初学着勿喷---关键在于获取每个视频的URL ---- json文件

空空如也

空空如也

原创手机壁纸-crawlspider-图片管道存储

原创字体反爬-起点月票