requests爬取网页遇到json(response乱码)

我的爬虫学习

requests爬取网页遇到json

当你用post去获取一个网页的源码,有时候会遇到post得到的response是一堆乱码,如下

{"controls":[],"custom":"{\"RowCount\": 20,\"Table\" :[{\"categorynum\":\"004001001001\",\"lbname\":\"\u5DE5\u7A0B\u5EFA\u8BBE\",\"infoid\":\"b803f0d7-2d7c-47ad-9f74-
6e88c5b6c00c\",\"titles\":\"\u4E34\u6D2E\u53BF\u5357\u82D1\u5C0F\u533A\u897F\u4FA7\u68DA\u6237\u533A\u6539\u9020\u9879\u76EE\",\"title\":\"<font color='#0066FF'>[\u4E34\u6D2E\u53BF]
<\\\/font>\u4E34\u6D2E\u53BF\u5357\u82D1\u5C0F\u533A\u897F\u4FA7\u68DA\u6237\u533A\u6539\u9020\u9879\u76EE<font color='#0066FF'>[\u5C1A\u672A\u62A5\u540D]<\\\/font>\",\"infodate\":\"2019-09-23\",

其实很简单 只需要把得到的content

content_json = json.loads(content)
#如果想把得到的代码再排序 可以
content_json = json.loads(content)['custom']
#这个要观察得到的代码 像这样的
{"controls":[],"custom":"
还有Table等常见的

然后再

for info in content_json
	info = ......

就可以得到有规律的源码了

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值