这次主要是进行京东具体某个店铺手机评论内容的爬取。
本来是跟上一起写的,只是没有时间一块做总结,现在写上来是有点生疏了。这里是暂时获取一个商品的评论内容
爬取的字段:评论内容,购买机型,评论人
上代码:
# -*- coding: utf-8 -*-
# @Time : 2017/9/18 23:16
# @Author : 蛇崽
# @Email : 17193337679@163.com
# @File : TaoBaoZUK1Detail.py zuk z1 详情页内容
import time
from selenium import webdriver
from lxml import etree
chromedriver = "C:\Program Files (x86)\Google\Chrome\Application\chromedriver.exe"
browser = webdriver.Chrome(chromedriver)
# 获取第一页的数据
def gethtml():
url = "https://detail.tmall.com/item.htm?id=531993957001&skuId=3609796167425&user