爬虫
kong_and_white
这个作者很懒,什么都没留下…
展开
-
针对文字图片使用pillow对图片进行操作并判断图片相似度
前言:最近想给维护的爬虫项目加点功能,摆脱人工实现自动化定时爬取,遇到的第一个难题就是登录获取cookie需要点触验证码识别,然后就进入了无止境的判断图片相似度,花了一周左右时间的尝试和查找资料,最终解决了这个问题,在此记录一下。pillow基础:Python图像处理PIL各模块详细介绍样例图片:第一步:将图片处理成黑白图片相关资料:使用python PIL库实现简单验证码的去噪import numpyfrom PIL import Imagedef get_bin_table(thre原创 2021-10-28 15:54:11 · 2233 阅读 · 2 评论 -
解决爬虫时遇到标题特殊编码导致存入为空的问题
今天写爬虫的时候报了特殊编码的错,像b‘\xd8’(这个印象最深)原创 2021-09-24 15:39:40 · 274 阅读 · 0 评论