![](https://img-blog.csdnimg.cn/20201014180756754.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
学习爬虫我所遇过的坑
文章平均质量分 60
腾阳
全网同名,欢迎关注
展开
-
验证码的识别 :tesserocr简单介绍以及如何 win10下如何安装tesserocr
现在越来越多的网站都会使用一些措施来反爬虫了,其中一个很常见的就是使用验证码。 验证码的种类很多,大体分成普通图形验证码,极验滑动验证码,点触验证码,微博宫格验证码等等。今天要解决的是第一种。 tesserocr是python的一个OCR识别库,但实际上是对tesseract做一个一层的python API封装,因此核心是tesseract。 我使用的是python3.6版本,win10系统...原创 2018-09-16 10:25:39 · 948 阅读 · 0 评论 -
验证码的识别:FileNotFoundError: [Errno 2] No such file or directory: 'code.jpg'
import tesserocr from PIL import Image image = Image.open('code.jpg') result = tesserocr.image_to_text(image) print(result) 没想到这样一个个小小的问题竟然卡了很久:FileNotFoundError: [Errno 2] No such file or directo...原创 2018-09-16 11:23:24 · 15575 阅读 · 1 评论