python抓取淘宝商品信息

该博客演示了如何利用Python的Selenium库抓取淘宝网站上的商品信息,包括商品图片、价格、标题、店铺名和所在地。数据通过PyQuery解析,并存储到MongoDB数据库中。
摘要由CSDN通过智能技术生成

from selenium import webdriver
from selenium.common.exceptions import TimeoutException
from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
from pyquery import PyQuery as pq
import pymongo
import re

client = pymongo.MongoClient('mongodb://localhost:27017/')
db = client['taobao']
MONGO_TABLE = 'detail'
browser = webdriver.Chrome('E:/CENTbro/CentBrowser/Application/chromedriver.exe')
wait = WebDriverWait(browser,10)

def search():
    try:
        browser.get('https://www.taobao.com/')
        input = wait.until(
            EC.presence_of_element_located((By.CSS_SELECTOR,'#q'))
        )
        submit = wait.until(EC.element_to_be_clickable((By.CSS_SELECTOR,'#J_TSearchForm > div.search-button > button'
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值