Firefox+python爬取京东评论存入csv

京东是动态页面,之前尝试用selenium获取,没有成功。看了网上其他实例用接口获取评论,尝试后成功了。
一、找接口
右击网页,打开检查元素,点击网络,刷新一下页面,找到这一条
在这里插入图片描述复制上图红笔圈出的网址,打开,可以看到里面是评论
在这里插入图片描述接着打开第二页评论,发现规律
在这里插入图片描述二、写代码


```python
import time
import requests
import json
import csv

def getcome (url):
    rep = requests.get(url,headers=header)
    rep.encoding = 'GBK'
    html = rep.text
     #去掉首尾无关字符
    jd = json.loads(html.lstrip('fetchJSON_comment98(').rstrip(');'))
    for co in jd['comments']:
        come = co['content']
        times = co['creationTime']
        types = co.setdefault('productColor','')#如果找不到购买类别,就为空
        csv_writer.writerow([times,types,come])

f = open('D:/JDcomments.csv','w',encoding='utf-8')
csv_writer = csv.writer(f)
csv_writer.writerow(["时间","类别","评论"])
header={'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:76.0) Gecko/20100101 Firefox/76.0',
        'Referer':"https://item.jd.com/100011516076.html"}
url1='https://club.jd.com/comment/productPageComments.action?callback=fetchJSON_comment98&productId=100011516076&score=0&sortType=5&page='
url2='&pageSize=10&isShadowSku=0&rid=0&fold=1'
for i in range(0,51):
    url=url1+str(i)+url2
    time.sleep(5)
    print(i)#当前页数
    getcome(url)
f.close()

#结果被存入csv中,用excel打开前需要先用记事本打开另存一下,再用excel打开,避免中文乱码

``
三、总结
只爬了一个商品的评论,还需要继续探索。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值