本次python实战,主要目标是利用 Python爬取京东商品评论数,如上图所示:爬取“Python之父”推荐的小蓝书,这些信息主要包括用户名、书名、评论等信息。
爬取的网址url是 https://item.jd.com/12531181.html ,爬取后的结果会保存在csv文件里面,便于数据分析。
01
如何准备爬虫环境?
其实不难
环境:MAC + Python3.6 ; IDE:Pycharm. 具体使用的模块如下。
import requests
但是如果你的系统上安装了anaconda,模块requests已经安装完成,但是 pycharm软件不能识别。
此时,需要使用preferences直接进行安装,入下图所示,点击+,直接安装即可。
02
爬虫分析真的很重要
准备工作
我们的目标是爬取京东的《零基础轻松学PYTHON》评论数,打开网页发现评论的页数很