爬虫
文章平均质量分 59
Aunean
这个作者很懒,什么都没留下…
展开
-
猫眼字体处理
猫眼字体处理 本次爬取猫眼的票房榜数据,打开检查工具可以看到,票房的数据都进行了加密 1.首先查看网页的源代码,Ctrl+f 输入 woff //vfile.meituan.net/colorstone/f0a30a4dda64b4f8f344858115f54fc92296.woff 可以选中这段复制到搜索框中回车,发现可以另存为一个文件,我们需要的就是这个,下载完直接打开发现是乱码,对此还需要处理。 2. 使用re下载woff文件,并用TTFont库进行处理 from fontTools.ttL原创 2021-09-18 16:54:58 · 287 阅读 · 0 评论 -
Scrapy存储json
Scrapy存储json 1.使用终端指令行方式 指令:scrapy crawl xxx -o filePath.文件类型 -s FEED_EXPORT_ENCODING=utf-8 -s FEED_EXPORT_ENCODING=utf-8 解决中文乱码 注意:持久化存储对应的文本文件类型只可以为 ‘json’, ‘jsonlines’, ‘jl’, ‘csv’, ‘xml’, ‘marshal’, ‘pickle’ 类型 2.直接创建并写入 json 文件 import os import cod原创 2021-09-18 16:54:15 · 493 阅读 · 0 评论