原标题:【实战好文】|爬取京东书籍评论并分析
这是菜鸟学Python的粉丝第10篇原创投稿
阅读本文大概需要5分钟
本篇作者:小郑同学
上周的赠书活动中,收到了楼主送的《利用Python进行数据分析》一书很是欣喜,在这里感谢楼主! 书籍是从京东送来的,于是萌生了一个想法,打算从京东上爬取用户的评论,看看用户对该书的大致评价(虽然我知道这本书是很实用的,肯定大多好评)并尝试做一些分析,看还有没有什么有趣的现象~~
要点:
用到的库:
pandas,numpy,requests,jieba,wordclould
工具:
Pycharm/Spyder
Python:3.6
1.爬虫对象
上京东搜索了一下,弹出了好多的商品,要找肯定就找那个评论数最多的,有4600+条评论,足够来分析了.
2.网页分析
和大多数情况一样,可以先利用浏览器的开发者工具,对网页的元素进行查看,看评论区是放在哪里,以便我们爬虫。于是经过一番观察,发现了这个:
哈哈,太简单了吧,评论都是在