Selenium爬取京东商品的好评与差评并写入EXCEL

本文介绍了如何利用Selenium模拟用户操作,抓取京东商品页面的好评与差评。首先获取商品链接,然后等待页面加载,依次点击“商品评价”和“好评”按钮。接着,提取好评的评论内容,将其写入Excel文件。同样方法处理差评。在实际操作中,需要注意文件追加和全屏浏览器避免元素遮挡等问题。
摘要由CSDN通过智能技术生成
动态HTML页面数据的获取可以使用request库得到服务器发送来的数据,但是京东商品评论包含全部评论、好评、中评、差评等。这里是用Selenium模拟点击转到相应的页面来获取页面内容,具体分为以下几个步骤:

1.得到商品页面链接,这里我们爬取Kindle: [https://item.jd.com/100000667370.html]
2. 等所有元素加载出,点击“商品评价”按钮,点击“好评“按钮
3. 等待页面加载完成,获取Html文档内容,当前页面好评的所有评论位置是"div", id=“comment-4"标签下所有的"div”,class_="comment-item"标签
4. 将内容写入EXCEL,这里进行文件是否存在的判断,进行文件创建或追加的,同时写入每一条数据的类型(好评还是差评)和字数。
5. 差评同理

完整代码

from bs4 import BeautifulSoup
import requests
import re
from selenium import webdriver
from bs4 import BeautifulSoup
import xlwt
import xlrd
import os
from xlutils.copy import copy
from selenium.webdriver.common.action_chains import ActionChains
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expe
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值