python识别文字坐标_汉字点击验证码识别_Python_qq_43561314的博客

最新推荐文章于 2024-08-07 08:26:20 发布

weixin_39975529

最新推荐文章于 2024-08-07 08:26:20 发布

阅读量1.1k

点赞数

文章标签： python识别文字坐标

本文介绍了如何使用Python结合Selenium和腾讯云字体识别服务来识别并点击网页上的验证码。首先通过Selenium模拟鼠标悬停显示验证码图片，然后利用腾讯云API进行文字识别，获取每个字符的中心坐标，最后通过ActionChains模拟点击这些坐标。

摘要由CSDN通过智能技术生成

在开始之前应该配置好selenium+firefox

一、得到验证码图片

只有当鼠标移动到验证码上时，图片才会显示出来。因此我们可以采用鼠标悬停的的方式显示验证码，并得到图片保存在本地。

鼠标悬停拥有两种方式，一种是悬停到具体坐标，另一种是悬停到某一具体元素。我们选择前一种，原因有两点：由于最后识别出验证码时，需要点击具体坐标（每个字并不具有相对应的元素）。并且每一次鼠标执行都会在上一次的移动的坐标下再次移动(因此需要元素的坐标)。from selenium import webdriver

from selenium.webdriver.common.action_chains import ActionChains

driver=webdriver.Firefox()

ActionChains(driver).move_by_offset(762.5,447.76).perform()

img=driver.find_element_by_xpath('//*[@id="jcaptchaimage"]')

二、验证码识别

字体验证码采用腾讯云字体识别（传输的图片信息必须是图片url或者base64编码）,返回识别字体及字体位置。字体位置返回的是相对图片验证码的字体四个顶点的位置，可以设置函数，得到字体中心距离坐标（相对验证码左上角）。from tencentcloud.common import credential

from tencentcloud.common.profile.client_profile import ClientProfile

from tencentcloud.common.profile.http_profile import HttpProfil

最低0.47元/天解锁文章

weixin_39975529

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。