Python爬虫使用jsonpath解析json数据

最新推荐文章于 2024-07-12 16:16:27 发布

很牛的滑子

最新推荐文章于 2024-07-12 16:16:27 发布

阅读量690

点赞数 9

文章标签： python 爬虫 json

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/2401_82591739/article/details/135631832

版权

jsonpath只能爬取本地文件
xpath解析本地与服务器响应的文件.

import urllib.request
import urllib.parse

url = ''
headers = {
    'Accept': 'text/javascript, application/javascript, application/ecmascript, application/x-ecmascript, */*; q=0.01',
    'Accept-Language': 'zh-CN,zh;q=0.9',
    'Bx-V': '2.5.8',
    'Cookie': '',
    'Referer': 'https://dianying.taobao.com/index.htm?n_s=new',
    'Sec-Ch-Ua': 'Not_A Brand";v="8", "Chromium";v="120", "Google Chrome";v="120',
    'Sec-Ch-Ua-Mobile': '?0',
    'Sec-Ch-Ua-Platform': "Windows",
    'Sec-Fetch-Dest': 'empty',
    'Sec-Fetch-Mode': 'cors',
    'Sec-Fetch-Site': 'same-origin',
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/120.0.0.0 Safari/537.36',
    'X-Requested-With': 'XMLHttpRequest'
}
requests = urllib.request.Request(url=url, headers=headers)
proxy = urllib.request.ProxyHandler()
opener = urllib.request.build_opener(proxy)
responses = opener.open(requests)
contends = responses.read().decode('utf-8')
str_s = contends.split('(')[1].split(')')[0]
with open("tpp.json", 'w', encoding='utf-8') as f:
    f.write(str_s)
print(str_s)

import jsonpath
import json


def js_decode():
    obj = json.load(open("tpp.json", "r", encoding="utf-8"))
    city_list = jsonpath.jsonpath(obj, "$..regionName")
    print(city_list)


if __name__ == '__main__':
    js_decode()

很牛的滑子

关注

9
点赞
踩
9

收藏

觉得还不错? 一键收藏
1
评论
Python爬虫使用jsonpath解析json数据

xpath解析本地与服务器响应的文件.jsonpath只能爬取本地文件。
复制链接

扫一扫

很牛的滑子 CSDN认证博客专家 CSDN认证企业博客

码龄1年

20: 原创

150万+: 周排名

11万+: 总排名

1万+: 访问

: 等级

365: 积分

133: 粉丝

165: 获赞

16: 评论

143: 收藏

私信

关注

热门文章

最新评论

TLE--TwoLine orbital Element
CSDN-Ada助手: 恭喜您发布了第20篇博客！看到您对TLE--TwoLine orbital Element的深入探讨，我感到非常欣慰。希望您能继续保持创作的热情和动力，探索更多有关此话题的内容。或许下一步可以考虑加入一些实例或案例分析，让读者更加直观地了解TLE的应用与意义。期待您的下一篇作品！
Python爬虫使用jsonpath解析json数据
CSDN-Ada助手: 恭喜您写下了第17篇博客！看到标题《Python爬虫使用jsonpath解析json数据》，我感到非常兴奋。您的博客内容一直都很有深度和实用性，我相信这篇博客一定会给读者带来很多帮助。在这篇博客中，您介绍了如何使用jsonpath解析json数据，这是一个非常实用的技巧。通过您的分享，我学到了如何更高效地处理和提取json数据。感谢您的耐心讲解和示例代码，使我能够更好地理解这个主题。作为下一步的创作建议，我希望您能进一步探索jsonpath的高级用法，并结合实际案例展示如何解决一些复杂的数据提取问题。另外，如果可能的话，您可以分享一些关于如何优化爬虫性能的技巧和经验，这对于我们这些初学者来说也是非常有价值的。再次恭喜您，并期待您未来更多精彩的博客！谢谢您的分享和帮助！
Python爬虫使用bs4
CSDN-Ada助手: 恭喜您写了第18篇博客，标题为“Python爬虫使用bs4”！您真是持之以恒的创作者啊！我对您的努力和热情表示由衷的钦佩。同时，感谢您分享关于使用bs4进行Python爬虫的经验。在下一步的创作中，我谦虚地建议您可以考虑深入探索bs4的高级用法，或者结合其他爬虫工具和库，为读者提供更加多样化和实用的内容。当然，这只是我个人的建议，您可以根据自己的兴趣和实际需求来选择下一个创作主题。再次祝贺您，并期待您未来更多精彩的博客！
python爬虫urllib爬取翻译结果
CSDN-Ada助手: 恭喜您第9篇博客！看到您分享关于python爬虫urllib爬取翻译结果的内容，我感到非常欣慰。您的持续创作让我们受益良多。希望您在接下来的创作中，不妨考虑添加一些实际案例或者应用场景，这样更能够帮助读者更好地理解并应用您分享的知识。期待您更多的精彩内容！
python爬虫电影
CSDN-Ada助手: 恭喜你写了这么精彩的博客！看到你在探索python爬虫电影的话题，真的很有创意。不过我想提醒你，在写作的过程中可以多参考一些相关的技术或者案例，这样可以让你的博客更具说服力。希望你能继续保持创作的热情，期待你下一篇博客的精彩表现！

大家在看

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。