【爬虫】Python实现,模拟天眼查登录验证获取token

项目介绍

注:本程序测试时期:2024.7.9,稳定可用
天眼查登录接口升级更新之后,后台接口login接口登录运用了4代极验gt,js逆向部分相当复杂。不建议走js逆向接口登录。建议通过selenium自动化破解验证码登录,成功获取token,也同样可以完成稳定持续性爬虫。

逻辑思路

1、自动化输入账密
2、绕过滑块验证、文字点选验证
思路描述:天眼查的验证会随机出现文字点选和滑块两种。文字点选可以通过接打码平台完成验证,需要产生少量费用。本程序主要实现了通过滑块破解技术完成验证码破解,实现免费通过验证登录,通过图像识别技术完成识别滑块缺口、再通过算法实现滑块拖动模拟人为轨迹完成登录
3、成功登录、获取token

效果演示

天眼查selenium模拟登录

部分代码展示

在这里插入图片描述

源代码获取

在这里插入图片描述
定价39.9元
欢迎私信我或评论区获取源码

爬虫(Web Crawler)是一种自动化程序,用于从互联网上收集信息。其主要功能是访问网页、提取数据并存储,以便后续分析或展示。爬虫通常由搜索引擎、数据挖掘工具、监测系统等应用于网络数据抓取的场景。 爬虫的工作流程包括以下几个关键步骤: URL收集: 爬虫从一个或多个初始URL开始,递归或迭代地发现新的URL,构建一个URL队列。这些URL可以通过链接分析、站点地图、搜索引擎等方式获取。 请求网页: 爬虫使用HTTP或其他协议向目标URL发起请求,获取网页的HTML内容。这通常通过HTTP请求库实现,如Python中的Requests库。 解析内容: 爬虫获取的HTML进行解析,提取有用的信息。常用的解析工具有正则表达式、XPath、Beautiful Soup等。这些工具帮助爬虫定位和提取目标数据,如文本、图片、链接等。 数据存储: 爬虫将提取的数据存储到数据库、文件或其他存储介质中,以备后续分析或展示。常用的存储形式包括关系型数据库、NoSQL数据库、JSON文件等。 遵守规则: 为避免对网站造成过大负担或触发反爬虫机制,爬虫需要遵守网站的robots.txt协议,限制访问频率和深度,并模拟人类访问行为,如设置User-Agent。 反爬虫应对: 由于爬虫的存在,一些网站采取了反爬虫措施,如验证码、IP封锁等。爬虫工程师需要设计相应的策略来应对这些挑战。 爬虫在各个领域都有广泛的应用,包括搜索引擎索引、数据挖掘、价格监测、新闻聚合等。然而,使用爬虫需要遵守法律和伦理规范,尊重网站的使用政策,并确保对被访问网站的服务器负责。
### 天眼 API 的免费使用方法 天眼提供了多种方式访问其企业信息数据库,其中包括官方的付费接口以及一些开源项目或第三方工具。以下是有关如何尝试获取天眼 API 接口并实现免费使用的相关信息。 #### 官方文档与试用版 天眼的企业工商信息询接口支持开发者申请接入服务[^4]。通常情况下,这类接口会提供一定额度的免费调用量供新用户测试功能。具体操作流程如下: - 注册成为开发者账户。 - 登录后进入应用管理页面创建新的应用程序实例。 - 获得初始 `access_token` 和其他必要参数用于构建 HTTP 请求头字段认证机制验证身份合法性[^1]。 对于希望节省成本但又需要频繁调取数据的应用场景来说,除了直接购买订阅计划之外还可以考虑利用公开可用的数据源或者自己动手开发类似的解决方案: #### 开发简易爬虫程序代替正式API调用 如果预算有限,则可以参考基于Python编写的脚本示例来自定义抓取目标网站上的结构化资料[^3]。需要注意的是,在实际部署前务必仔细阅读目标站点的服务条款以免违反相关规定造成不必要的麻烦;同时也要注意控制请求频率避免触发对方服务器防护措施导致IP被封禁等问题发生。 另外值得注意的一点是,虽然这种方法能够在一定程度上满足基本需求,但由于缺乏稳定性保障加之可能面临法律风险等因素影响并不推荐长期依赖此类手段处理重要业务逻辑环节中的核心部分。 ```python import requests url = 'https://www.tianyancha.com/search' headers = { 'User-Agent': 'your user agent string', 'Cookie' : 'your cookie value here' } params={'key':'example company name'} response=requests.get(url, headers=headers,params=params) if response.status_code==200: print(response.text) else: raise Exception('Failed to retrieve data') ``` 以上仅为演示用途,请根据实际情况调整相应变量值后再执行上述代码片段。 #### 可视化展示方案探讨 针对更高级别的交互体验要求而言,采用D3.js库绘制动态图形不失为一种理想的选择之一[^5]。它允许我们灵活操控DOM节点从而创造出极具吸引力的画面效果的同时还能保持良好的性能表现水平。 ---
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

会振刀的程序员

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值