一、前言
基于评论信息做情感分析模型第一步,收集数据。这里准备抓取京东商城的物品评论,大致可以分为两步。
1、获取商品id
2、获取商品评论
二、实战
接下来的代码都基于scrapy框架编写,请确保已经了解scrapy基础知识。
1、获取商品id
从京东商城首页随意点击进入一个子类,这里选取家电类: https://jiadian.jd.com/,可以看到这个页面已经有商品存在:
很明显,这里的url后面的数字就这个物品id,右键点击查看源代码,查找: item.jd.com:
还不错,一个页面有400多