- 博客(6)
- 收藏
- 关注
转载 Scrapy框架学习
Scrapy框架学习常用的命令Scrapy项目下的结构Scrapy框架的整体执行流程转载文章 : 原文链接.crapy Engine(引擎): 负责Spider、ItemPipeline、Downloader、Scheduler中间的通讯,信号、数据传递等。Scheduler(调度器): 它负责接受引擎发送过来的Request请求,并按照一定的方式进行整理排列,入队,当引擎需要时,交还给引擎。Downloader(下载器): 负责下载Scrapy Engine(引擎)发送的所有Requests请求
2020-11-27 05:11:02 412
原创 win10+python3.8下安装scrapy
Scarpy依赖四个包1.wheel 2.Lxml 3.twisted 4.Pywin32wheel的安装教程: 可通过再命令行直接输入pip install wheelLxml 的安装教程: Lxml 下载链接.进入网站找到对应的Lxml安装包的下载链接,cp3.9对应python3.9的版本,根据计算机系统32位或64位的安装包.下载完成后,运行cmd,进入命令行模式,输入pip install + 文件路径即可ex: pip install C:\Users\Twisted-18.7.0-c
2020-11-27 01:48:33 465
原创 python 从PDF文件中读取书签/目录
python 从PDF文件中读取书签/目录一级目录二级目录三级目录使用python3 , 需导入PyPDF2模块from PyPDF2 import PdfFileReader as pdf_read#每个书签的索引格式#{'/Title': '书签名', '/Page': 指向的目标页数, '/Type': '类型'}directory_str = ''def bookmark_listhandler(list): global directory_str fo
2020-11-24 23:14:03 8682
原创 python自动为PDF文件导入书签
python自动为PDF文件导入书签目录文本的具体格式代码分析目录文本的具体格式第1章 绪论$1 1.1模块与接口$1 1.2 工具和软件$3 1.3树语言的数据结构$3 程序设计:直线式程序解释器$7 推荐阅读$8 习题$9第2章 词法分析$10 2.1词法单词$10 2.2正则表达式$11 2.3有限自动机$13 2.4非确定有限自动机$15 2.4.1将正则表达式转换为NFA$16
2020-11-24 15:18:13 433
原创 使用python为pdf文件添加书签
使用python添加多级书签的方法#PDF嵌套书签编辑方法1.导入PyPDF2的模块包2.addBookmark是向PDF对象中添加书签的函数,第一个参数为书签名,第二个参数为书签指向的页数,第三个参数为父书签; 还有其它的参数具体请查阅资料; addBookmark函数会返回一个书签对象,因此可在添加完父书签后存储返回的标签对象,当添加子书签时将该对象作为参数传递具体代码如下所示:from PyPDF2 import PdfFileWriter,PdfFileReaderoutput =
2020-11-24 14:57:55 1846
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人