极验滑块验证的使用

 

# 爬取河南企业信用信息公示系统为案例
# 案例网址 http://gsxt.haaic.gov.cn/index.jspx

 

下面这个选项一定要勾选

极验打码要的参数

 

 要爬取数据所在的页面

 

 

 根据上面的截图然后找到相对应的菜蔬  然后下面这个代码就可以实现打印list页面的源代码 ,剩下的就是用解析器解析的部分。

 

 

import requests
import json
from urllib.parse import quote
class Qy():
    def __init__(self):
        self.headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/66.0.3359.139 Safari/537.36'}
        self.req = requests.session()


    def get_html(self,url):
        try:
            response = self.req.get(url,headers=self.headers)
            if response.status_code == 200:
                return response.text
            return None
        except:
            print('获取challenge和ht信息失败')

    def parse_html(self,html):
        html_dic = json.loads(html)
        url = "http://jiyanapi.c2567.com/shibie?user=username&pass=123456&return=json&ip=&gt=" + html_dic['gt'] + "&challenge=" + html_dic['challenge']
        return self.get_html(url)

    def get_page_html(self,html_json):
        url = 'http://gsxt.haaic.gov.cn/validateSecond.jspx'
        html_dic = json.loads(html_json)
        data = {
            'searchText': '中国',
            'geetest_challenge': html_dic['challenge'],
            'geetest_validate': html_dic['validate'],
            'geetest_seccode': html_dic['validate']+'|jordan',
        }
        html = self.req.post(url,headers=self.headers,data=data).text
        html_di = json.loads(html)
        name = quote(quote('中国'))
        url1 = 'http://gsxt.haaic.gov.cn/'+html_di['obj']+'&searchType=1&entName='+name
        return self.req.get(url,headers=self.headers).text



def main():
    qy = Qy()
    # 获取challenge和ht信息
    html = qy.get_html('http://gsxt.haaic.gov.cn/registerValidate.jspx')
    # 使用打码平台进行打码
    html_json = qy.parse_html(html)
    # 获取网页的数据
    data = qy.get_page_html(html_json)
    # 打印网页的数据
    print(data)


if __name__ == '__main__':
    main()

 

 

 

 

转载于:https://www.cnblogs.com/zlel/p/9042769.html

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值