python爬虫提取人名_Python爬虫(json的数据提取)

json方法

json字符串--------->json.loads()---------->python数据类型

python数据类型---------->json.dumps()----------->json字符串

jsonpath介绍

用来解析多层嵌套的json数据757ddb9e93443b5f215ce0ff6020b024164cb0c8.png

#处理动态数据

import json

from jsonpath import jsonpath

import requests

import re

url = 'https://sclub.jd.com/comment/productPageComments.action?callback=fetchJSON_comment98vv108&productId=47957967985&score=0&sortType=5&page=0&pageSize=10&isShadowSku=0&fold=1'

headers = {

'Referer': 'https://item.jd.com/47957967985.html',

'Sec-Fetch-Mode': 'no-cors',

'Sec-Fetch-Site': 'same-site',

'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/79.0.3945.117 Safari/537.36'

}

response = requests.get(url,headers=headers).content.decode('gbk')

# print(response)

data = re.search(r'{.*}',response).group()

data1 = json.loads(data)

data2 = jsonpath(data1,'$.comments[*].content')

for i in data2:

print(i)

print("**"*30)

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值