动态爬取京东商品评论,Selenium与json交互
需求:用selenium爬取京东商城某一款华为手机的评论,要求至少爬取2000条 用户名和用户评论网址为https://www.jd.com/,将这些信息存入csv文件中,文件后缀为.csv。 将ipynb文件和后缀为.csv的文件压缩打包
不得不说,这一篇还是很有坑点的:
- 商品评论的id达到一定次数后会自动更换id;
- 其次,商品id号的更换可在首页进行所有商品的url获取,然后通过random.choice()进行随机选取,之后就是评论的事情了;
- 这时候你会发现,这里的商品信息全是动态加载的…json就来了,而非常蛋疼的一件事就是,selenium不能跟json直接交互解析,所以笔者子