selenium li标签怎么点击_Selenium爬取京东商品的好评与差评并写入EXCEL

动态HTML页面数据的获取可以使用request库得到服务器发送来的数据,但是京东商品评论包含全部评论、好评、中评、差评等。这里是用Selenium模拟点击转到相应的页面来获取页面内容,具体分为以下几个步骤:

1.得到商品页面链接,这里我们爬取Kindle: [【Kindlekindle】Kindle paperwhite4 电子书阅读器 电纸书墨水屏6英寸wifi黑色 8G【行情 报价 价格 评测】-京东]

2. 等所有元素加载出,点击“商品评价”按钮,点击“好评“按钮

3. 等待页面加载完成,获取Html文档内容,当前页面好评的所有评论位置是"div", id=“comment-4"标签下所有的"div”,class_="comment-item"标签

4. 将内容写入EXCEL,这里进行文件是否存在的判断,进行文件创建或追加的,同时写入每一条数据的类型(好评还是差评)和字数。

5. 差评同理

---------------------

注意几点问题

*EXCEL的追加只能是先copy再覆盖

*driver全屏打开,”下一页"元素被挡住的话就点击不到,出现not clickable的错误

*点击”商品评价"按钮时,系统默认会加载“全部评价”,所以“dd=driver.find_elements_by_css_selector(‘a.ui-pager-next’)”是一个列表,而dd[0]是“全部评价”下的“下一页”

---------------------

完整代码

from bs4 import BeautifulSoup
imp
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值