python阿里巴巴_阿里图片采集,python selenium 采集阿里巴巴商品图片数据

[Python] 纯文本查看 复制代码#采集阿里巴巴商品图片数据

from selenium import webdriver

import time

import requests

import os

import re

def crawle(url):

browser = webdriver.Chrome()

browser.get(url=url)

# 将滚动条移动到页面的底部

js = "var q=document.documentElement.scrollTop=100000"

browser.execute_script(js)

time.sleep(5)

#打印当前网页源码

#print(browser.page_source)

#获取当前网页标题

title=browser.title

title=title.replace(" - 阿里巴巴","")

title= re.sub(r'[\|\/\\:\*\?\\\"]', "_", title)

print(title)

os.makedirs(f"alibb/{title}/", exist_ok=True)

#获取当前网页链接

website=browser.current_url

print(website)

#创建txt文档并保存商品数据

fname='spider'

shopping='%s%s%s%s'%(website,

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值