python url加密解密_python解密百度加密链接的脚本

发个脚本吧。因为一般百度的超链接爬下来都是未解密的,导致数据用处不大,解密后就有很多用处了

下面是代码:做了两个版本。第二个速度和稳定性更好

1、

import requests

zhen = open('zhen.txt','w')

for i in open('url.txt'):

r = requests.get(i.rstrip())

zhen.write(r.url+'\n')

2、

import requests

zhen = open('zhen.txt','w')

for i in open('url.txt'):

header = requests.head(i.rstrip()).headers

r = header['location']

zhen.write(r +'\n')

url.txt放需要解密的url。结束后会生成zhen.txt。里面就是解密过的了。要注意解密的过程中会因为某个url加载慢,url不存在等错误停止解密,需要重新再来几次才可以。大家可以自己写可以跳过错误或者自动重来的脚本。

3、本身解密就是为了爬取百度的结果,平时是用火车头抓取,python解密的,今天突然测试出让火车头在抓取过程中就可以解密的方法了。原理是抓取后的链接,后面加上&wd=就会进入跳转模式,跳转模式里是有目标网页的,截取出来就可以了。下面放设置

4.唔知大神优化了下,发了个防报错的脚本,下面摘录下

def gethtml(url,Device=None,method=None):

# request URL请求函数

if Device ==None:

UserAgent = ''

elif Device =='Mobile':

UserAgent = ''

headers = {

'User-Agent':UserAgent,

}

try:

htmlobj = requests.get(url,headers=headers,all_redirects=False,timeout =1)

except:

traceback.print_exc()

else:

if htmlobj.status_code == 200:

return htmlobj.text

分享到:

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值