爬取淘宝商品图片(仅用于技术交流)

爬取淘宝商品图片(仅用于技术交流)

主要用的是selenium自动化工具

#! /usr/bin/env python
# -*-.coding: utf-8 -*-
# __author__ = 'xiaobai'
# Email: 517840374@qq.com

# 安装selenium

from selenium.webdriver import Chrome
from selenium.webdriver.common.keys import Keys
import time
import requests

# 创建浏览器
browser = Chrome()

browser.get("http://www.taobao.com")

browser.find_element_by_xpath('//*[@id="q"]').send_keys('男装', Keys.ENTER)
while 1:
# 让程序等着,用户手动登录
    while browser.current_url.startswith("https://login.taobao.com"):
        print("等着")
        time.sleep(1)
    n = 1
    # 7 开始查找图片
    items = browser.find_element_by_class_name("m-itemlist").find_elements_by_class_name('item')
    for item in items:
        src_path = item.find_element_by_class_name('pic-box').find_element_by_tag_name('img').get_attribute("data-src")
        print(src_path)
        src_path = 'http:'+src_path
        # 下载这张图片,保存到文件中
        # open(f"{n}.jpg",'wb').write(requests.get(src_path).content)
        n += 1

    pages = browser.find_element_by_class_name("m-page").find_element_by_class_name('J_Submit')
    browser.execute_script("arguments[0].click();", pages)
    time.sleep(10)
    print('下一页')
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值