使用selenium爬取淘宝商品

最新推荐文章于 2024-06-07 14:18:27 发布

Juno的学习日记

最新推荐文章于 2024-06-07 14:18:27 发布

阅读量1.5k

点赞数

分类专栏：爬虫文章标签： selenium python 爬虫

本文链接：https://blog.csdn.net/weixin_45075241/article/details/90648159

版权

爬取的页面是：“https://s.taobao.com/search?q=手机”，这个是淘宝搜索手机时候的网址。
在这里插入图片描述
爬取的思路：使用selenium来模拟登陆淘宝，然后爬取这一页中商品的一些信息；爬取完以后，找到输入页面的输入框，依次输入下一页的页码，比如刚刚爬的是第一页，就输入2，再点击确定按钮，以此类推，就可以实现翻页的功能。其中需要多次使用WebDriverWait，来保证需要爬取的内容出现，再进行爬取。

需要使用的库和初始化：

from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.support import expected_conditions as EC
from selenium.webdriver.support.wait import WebDriverWait
from pyquery import PyQuery as pq
import time
import pandas as pd
import csv

driver = we

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

Juno的学习日记

关注关注

0
点赞
踩
7

收藏

觉得还不错? 一键收藏
0
评论
使用selenium爬取淘宝商品

爬取的页面是：“https://s.taobao.com/search?q=手机”，这个是淘宝搜索手机时候的网址。爬取的思路：使用selenium来模拟登陆淘宝，然后爬取这一页中商品的一些信息；爬取完以后，找到输入页面的输入框，依次输入下一页的页码，比如刚刚爬的是第一页，就输入2，再点击确定按钮，以此类推，就可以实现翻页的功能。其中需要多次使用WebDriverWait，来保证需要爬取的内容出...
复制链接

扫一扫