点击——>要爬取网址
作为一个爬虫小白解决问题是十分蛋疼的(Φ皿Φ),就这几行代码,我折磨了一下午,然后我发现,学习代码最大的难题是学习资源获取的途径并不是代码本身,只要学,任何人都能学会
1.先到达页面打开开发者模式(F12),点击商品评论,我们随便的复制一些字,去源码里搜搜发现没有这句话,就知道是动态页面了,该去找json文件了
开发者选项
2.我们进入Network,去filter里面打comment,一般评论关键词就这个,然后去翻里面的请求,随便翻翻就找到了,也不是瞎翻,重点是js请求
找评论
3.知道了这个是相应的请求了,去headers弄url,去看看怎么样
复制url
看到评论了
4下面开始搞代码
import requests
import json
headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/65.0.3325.181 Safari/537.36'}
url = 'https://sclub.jd.com/comment/productP