JS+Selenium+excel追加写入，使用python成功爬取京东任何商品

最新推荐文章于 2020-11-21 03:11:36 发布

Python新世界

最新推荐文章于 2020-11-21 03:11:36 发布

阅读量226

点赞数

文章标签： python Python编程编程语言 Python爬虫

本文链接：https://blog.csdn.net/weixin_46089319/article/details/105813693

版权

本文介绍了使用Python结合Selenium爬取京东任意商品信息的实践，尽管效率相对较低，但避免了请求限制。还提到了通过结合大牛的方法将数据追加写入Excel文件，计划进一步优化并进行词云分析。

摘要由CSDN通过智能技术生成

之前一直是requests库做爬虫，这次尝试下使用selenium做爬虫，效率不高，但是却没有限制，文章是分别结合大牛的selenium爬虫以及excel追加写入操作而成，还有待优化，打算爬取更多信息后进行词云分析

'''
爬取京东商品信息:
    请求url:
        https://www.jd.com/
    提取商品信息:
        1.商品详情页
        2.商品名称
        3.商品价格
        4.评价人数
        5.商品商家
'''
# coding=UTF-8
from selenium import webdriver
from selenium.webdriver.common.keys import Keys
import time
import xlrd
import xlwt
from xlutils.copy import copy


def write_excel_xls(path, sheet_name, value):
    index = len(value)  # 获取需要写入数据的行数
    workbook = xlwt.Workbook()  # 新建一个工作簿
    sheet = workbook.add_sheet(sheet_name)  # 在工作簿中新建一个表格
    for i in range(0, index):
        for j in range(0, len(value[i])):
            sheet.write(i, j, value[i][j])  # 像表格中写入数据（对应的行和列）
    workbook.save(path)  #

最低0.47元/天解锁文章

Python新世界

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
JS+Selenium+excel追加写入，使用python成功爬取京东任何商品

之前一直是requests库做爬虫，这次尝试下使用selenium做爬虫，效率不高，但是却没有限制，文章是分别结合大牛的selenium爬虫以及excel追加写入操作而成，还有待优化，打算爬取更多信息后进行词云分析'''爬取京东商品信息: 请求url: https://www.jd.com/ 提取商品信息: 1.商品详情页 ...
复制链接

扫一扫