Python爬虫之获取淘宝商品信息

最新推荐文章于 2024-09-30 09:30:48 发布

大咖爱爬虫

最新推荐文章于 2024-09-30 09:30:48 发布

阅读量4.2k

点赞数 1

分类专栏： Python学习 Python 大数据

本文链接：https://blog.csdn.net/ajian6/article/details/106348860

版权

这篇博客介绍了如何利用Python的selenium库抓取淘宝商品信息。首先讲解了selenium的基本概念、安装和配置，接着阐述了selenium的元素定位方法。然后，通过实例演示了如何搜索商品、获取商品信息并进行翻页爬取。最后，提供了获取价格、商品名称、付款人数和店铺名称等关键信息的代码示例。

摘要由CSDN通过智能技术生成

首先需要先导入webdriver

from selenium import webdriver
复制代码

webdriver支持主流的浏览器，比如说：谷歌浏览器、火狐浏览器、IE浏览器等等

然后可以创建一个webdriver对象，通过这个对象就可以通过get方法请求网站

driver = webdriver.Chrome()	# 创建driver对象
driver.get('https://www.baidu.com')	# 请求百度
复制代码

接下来可以定义一个方法：search_product

selenium是一个用于测试网站的自动化测试工具，支持很多主流的浏览器，比如：谷歌浏览器、火狐浏览器、IE、Safari等。

如windows、Linux、IOS、Android等。

打开终端输入

pip install Selenium
复制代码

2、火狐浏览器驱动文件下载：点击下载geckodriver

配置环境变量的方法非常简单，首先将下载好的驱动进行解压，放到你安装Python的目录下，即可。

因为之前，在配置Python环境变量的时候，就将Python的目录放到我的电脑–>属性–>系统设置–>高级–>环境变量–>系统变量–>Path

1、id

2、name

3、class name

4、tag name

5、link text

6、partial link text

7、xpath

8、css selector

定义一个元素	定位多个元素	含义
find_

关注

专栏目录