- 博客(1)
- 收藏
- 关注
原创 Python Tesseract识别验证码
我们在写爬虫的时候经常遇到网页需要登陆的情况, 如果是一次性爬虫的话, 可以用Cookie等方式模拟登录, 但如果要持续性运行的爬虫, 就要考虑自动登录, 而在登录时, 验证码是最常遇到, 需要处理的问题. tesseract是一款开源的OCR识别引擎, 我们也可以对它进行不断地训练, 提高识别率. 在验证码处理中, 我们就将利用它进行验证码识别.
2018-11-15 16:07:19 6954 1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人