python3实现爬取淘宝页面的商品的数据信息（selenium+pyquery+mongodb）

最新推荐文章于 2024-05-16 16:37:49 发布

flood_d

最新推荐文章于 2024-05-16 16:37:49 发布

阅读量3.1k

点赞数 1

本文链接：https://blog.csdn.net/DH_SIR/article/details/78504303

版权

1.环境须知
做这个爬取的时候需要安装好python3.6和selenium、pyquery等等一些比较常用的爬取和解析库，还需要安装MongoDB这个分布式数据库。
2.直接上代码
spider.py

import re
from config import *
import pymongo
from selenium import webdriver
from selenium.common.exceptions import TimeoutException
from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
from pyquery import PyQuery as pq
#mongodb配置信息
client = pymongo.MongoClient(MONGO_URL)
db = client[MONGO_DB]
#打开chrome浏览器
browser = webdriver.Chrome()
wait = WebDriverWait(browser, 10)
#第一次搜索页面的方法
def search

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

flood_d

关注关注

1
点赞
踩
9

收藏

觉得还不错? 一键收藏
1
评论
python3实现爬取淘宝页面的商品的数据信息（selenium+pyquery+mongodb）

1.环境须知做这个爬取的时候需要安装好python3.6和selenium、pyquery等等一些比较常用的爬取和解析库，还需要安装MongoDB这个分布式数据库。 2.直接上代码 spider.pyimport refrom config import *import pymongofrom selenium import webdriverfrom selenium.com
复制链接

扫一扫