自定义博客皮肤VIP专享

*博客头图：

点击选择上传的图片

格式为PNG、JPG，宽度*高度大于1920*100像素，不超过2MB，主视觉建议放在右侧，请参照线上博客头图

请上传大于1920*100像素的图片！

博客底图：

点击选择上传的图片

图片格式为PNG、JPG，不超过1MB，可上下左右平铺至整个背景

栏目图：

点击选择上传的图片

图片格式为PNG、JPG，图片宽度*高度为300*38像素，不超过0.5MB

主标题颜色：

RGB颜色，例如：#AFAFAF

Hover：

RGB颜色，例如：#AFAFAF

副标题颜色：

RGB颜色，例如：#AFAFAF

预览取消提交

自定义博客皮肤

-+

上一步保存

龙纸人的博客

代码编写分享

转载 Scrapy框架学习

Scrapy框架学习常用的命令Scrapy项目下的结构Scrapy框架的整体执行流程转载文章 : 原文链接.crapy Engine(引擎): 负责Spider、ItemPipeline、Downloader、Scheduler中间的通讯，信号、数据传递等。Scheduler(调度器): 它负责接受引擎发送过来的Request请求，并按照一定的方式进行整理排列，入队，当引擎需要时，交还给引擎。Downloader(下载器): 负责下载Scrapy Engine(引擎)发送的所有Requests请求

2020-11-27 05:11:02 434

转载 Scrapy框架学习

链接: Scrapy框架.

2020-11-27 01:59:02 150

原创 win10+python3.8下安装scrapy

Scarpy依赖四个包1.wheel 2.Lxml 3.twisted 4.Pywin32wheel的安装教程: 可通过再命令行直接输入pip install wheelLxml 的安装教程: Lxml 下载链接.进入网站找到对应的Lxml安装包的下载链接，cp3.9对应python3.9的版本,根据计算机系统32位或64位的安装包.下载完成后，运行cmd，进入命令行模式,输入pip install + 文件路径即可ex: pip install C:\Users\Twisted-18.7.0-c

2020-11-27 01:48:33 511

原创 python 从PDF文件中读取书签/目录

python 从PDF文件中读取书签/目录一级目录二级目录三级目录使用python3 , 需导入PyPDF2模块from PyPDF2 import PdfFileReader as pdf_read#每个书签的索引格式#{'/Title': '书签名', '/Page': 指向的目标页数, '/Type': '类型'}directory_str = ''def bookmark_listhandler(list): global directory_str fo

2020-11-24 23:14:03 9402

原创 python自动为PDF文件导入书签

python自动为PDF文件导入书签目录文本的具体格式代码分析目录文本的具体格式第1章绪论$1 1.1模块与接口$1 1.2 工具和软件$3 1.3树语言的数据结构$3 程序设计：直线式程序解释器$7 推荐阅读$8 习题$9第2章词法分析$10 2.1词法单词$10 2.2正则表达式$11 2.3有限自动机$13 2.4非确定有限自动机$15 2.4.1将正则表达式转换为NFA$16

2020-11-24 15:18:13 467

原创使用python为pdf文件添加书签

使用python添加多级书签的方法#PDF嵌套书签编辑方法1.导入PyPDF2的模块包2.addBookmark是向PDF对象中添加书签的函数,第一个参数为书签名,第二个参数为书签指向的页数,第三个参数为父书签; 还有其它的参数具体请查阅资料; addBookmark函数会返回一个书签对象,因此可在添加完父书签后存储返回的标签对象,当添加子书签时将该对象作为参数传递具体代码如下所示:from PyPDF2 import PdfFileWriter，PdfFileReaderoutput =

2020-11-24 14:57:55 1966

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示

确定要删除当前文章？

取消删除