百度返回的JSON数据解析返回的objURL（python版本）

最新推荐文章于 2023-05-03 21:26:50 发布

天心有情

最新推荐文章于 2023-05-03 21:26:50 发布

阅读量3.6k

点赞数 6

分类专栏： scrapy 文章标签： objURL python解析objURL 百度objURL

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/sinat_35045195/article/details/79205578

版权

scrapy 专栏收录该内容

2 篇文章 0 订阅

订阅专栏

这几天需要写一个爬虫（用的是Python的Scrapy框架），但是获得百度的数据之后发现获得的图片的objURL是算法加密的，于是就网上找了找怎么解析百度的objURL数据，经过多方磨难，写出了以下Python语言的解密代码。这里贴出来用于分享和备忘。（高手绕道）

import re
txt = 'ippr_z2C$qAzdH3FAzdH3Fv8_z&e3Biwtkw5_z&e3BvgAzdH3Ft42AzdH3Fmaa_a_8aa_8AzdH3F89089dn8bl_z&e3B0l8dAzdH3F80dblmvvdddnjck9nnka1jjn9kwkmjbw_z&e3B3r2'
def  baidtu_uncomplie(url):
    res = ''
    c = ['_z2C$q', '_z&e3B', 'AzdH3F']
    d= {'w':'a', 'k':'b', 'v':'c', '1':'d', 'j':'e', 'u':'f', '2':'g', 'i':'h', 't':'i', '3':'j', 'h':'k', 's':'l', '4':'m', 'g':'n', '5':'o', 'r':'p', 'q':'q', '6':'r', 'f':'s', 'p':'t', '7':'u', 'e':'v', 'o':'w', '8':'1', 'd':'2', 'n':'3', '9':'4', 'c':'5', 'm':'6', '0':'7', 'b':'8', 'l':'9', 'a':'0', '_z2C$q':':', '_z&e3B':'.', 'AzdH3F':'/'}
    if(url==None or 'http' in url):
        return url
    else:
        j= url
        for m in c:
            j=j.replace(m,d[m])
        for char in j:
            if re.match('^[a-w\d]+$',char):
                char = d[char]
            res= res+char
        return res

print(baidtu_uncomplie(txt))

txt内容为获得的objURL内容，最后解密后打印出来为

http://c1.haibao.cn/img/600_0_100_1/1471423189.7912/172896cc2223e5b433b0dee34bab6e8a.jpg

好了Python解析就完成了。

关注

6
点赞
踩
14

收藏

觉得还不错? 一键收藏
打赏
4
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

天心有情 CSDN认证博客专家 CSDN认证企业博客

码龄8年

请填写具体企业名称、岗位名称

105: 原创

2万+: 周排名

231万+: 总排名

33万+: 访问

: 等级

3664: 积分

3051: 粉丝

146: 获赞

88: 评论

311: 收藏

私信

关注

热门文章

分类专栏

区块链 1篇
dolphinscheduler 5篇
Spark学习之路-思想 5篇
Spark学习之路-源码 14篇
操作系统 1篇
CDH 2篇
linux 2篇
Spark 29篇
SparkRPC 8篇
hadoop 9篇
scala 8篇
Zookeeper 1篇
hive 6篇
scrapy 2篇
HBase 5篇
HDFS 4篇
java 12篇
neo4j 4篇
kafka 2篇
机器学习数据集 1篇
spark机器学习 1篇
坑爹那回事 24篇
图解大数据 3篇
图数据库 3篇
Greenplum 2篇
SparkGraphX 1篇

最新评论

Could not find acceptable representation 原因探究
spum: 你这个重写就离谱，正确是遍历，改变list里面的对应的转换器对象，不是让你重新把整个list覆盖，springboot里面的转换器已经很全了，你把list覆盖掉自己添加？？而且你这里也没添加全，正确的是压根不需要你去添加list，只需要去遍历他
scala中extends和with的使用
weixin_45848850: 依托答辩
dolphinscheduler源码环境配置
789请问: 还是报错，大佬: org.apache.maven.model.building.ModelBuildingException: 1 problem was encountered while building the effective model for org.apache.dolphinscheduler:dolphinscheduler-registry-zookeeper:2.0.0 [ERROR] Non-resolvable import POM: Could not transfer artifact org.springframework.boot:spring-boot-starter-parent:pom:2.1.18.RELEASE from/to central (http://repo.maven.apache.org/maven2): Failed to transfer http://repo.maven.apache.org/maven2/org/springframework/boot/spring-boot-starter-parent/2.1.18.RELEASE/spring-boot-starter-parent-2.1.18.RELEASE.pom. Error code 501, HTTPS Required @ org.apache.dolphinscheduler:dolphinscheduler:2.0.0, F:\99code\webHt\Java\dolphinscheduler\apache-dolphinschedulerSrc\pom.xml, line 171, column 25 at org.apache.maven.model.building.DefaultModelProblemCollector.newModelBuildingException(DefaultModelProblemCollector.java:195) at org.apache.maven.model.building.DefaultModelBuilder.build(DefaultModelBuilder.java:419) at org.apache.maven.model.building.De
Neo4j性能测试
weixin_46040059: 明白了，多谢啦
Neo4j性能测试
天心有情: 是的，用的是shell查询，服务也需要反复关闭，预热就是提前查询一次，第二次查询，第一次查询无论在哪查询一样的

最新文章

目录

评论 4

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

天心有情 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。