爬取淘宝商品图片(仅用于技术交流)
主要用的是selenium自动化工具
#! /usr/bin/env python
# -*-.coding: utf-8 -*-
# __author__ = 'xiaobai'
# Email: 517840374@qq.com
# 安装selenium
from selenium.webdriver import Chrome
from selenium.webdriver.common.keys import Keys
import time
import requests
# 创建浏览器
browser = Chrome()
browser.get("http://www.taobao.com")
browser.find_element_by_xpath('//*[@id="q"]').send_keys('男装', Keys.ENTER)
while 1:
# 让程序等着,用户手动登录
while browser.current_url.startswith("https://login.taobao.com"):
print("等着")
time.sleep(1)
n = 1
# 7 开始查找图片
items = browser.find_element_by_class_name("m-itemlist").find_elements_by_class_name('item')
for item in items:
src_path = item.find_element_by_class_name('pic-box').find_element_by_tag_name('img').get_attribute("data-src")
print(src_path)
src_path = 'http:'+src_path
# 下载这张图片,保存到文件中
# open(f"{n}.jpg",'wb').write(requests.get(src_path).content)
n += 1
pages = browser.find_element_by_class_name("m-page").find_element_by_class_name('J_Submit')
browser.execute_script("arguments[0].click();", pages)
time.sleep(10)
print('下一页')