验证码识别
我们使用爬虫时很有可能需要登录,而现在的平台登陆时都需要验证码才能完成登录,所以我们使用爬虫模拟登录时验证码是必须要跨过的坎。一般情况下,我们使用第三方平台实现验证码的识别。
所以我在这里介绍一个识别验证码的平台——图鉴(比较常见的有超级鹰,反正其实这些平台注册、使用流程都差不多)。
首先我们打开图鉴的网址 “ http://www.ttshitu.com/ ”,点击注册
登录成功后,我们首先看一下“价格”,其实也可以在注册帐号前看一看价格,再决定是否注册。在登陆后,因为识别验证码需要登录,所以我们在使用前要确定自己的帐号里是否还有余额。我觉得这些平台的充值还是挺人性化的,,是允许我们在平台上充值一块五毛的。
我们的账号里有钱了,然后再打开开发文档。因为我们使用的是python,所以我们选择python的开发文档