京东商城无人机自动爬取

from selenium import webdriver
import time
import random

获取网页

driver = webdriver.Chrome()
url = ‘https://www.jd.com’
driver.get(url)

搜索输入框

tb_input = driver.find_element_by_css_selector(’#key’)

搜索按钮

search_btn = driver.find_element_by_css_selector(’.button’)

需要搜索的内容

tb_input.send_keys(‘无人机’)

设置休眠时间

time.sleep(2)
search_btn.click()

for page in range(5):
# 模拟拖动滚动条到浏览器底部
for i in range(5):
driver.execute_script(‘window.scrollTo(0,document.doby.scrollHeight):’)
time.sleep(random.random() + 1)
# 商品信息处理
ls = driver.find_element_by_css_selector(’.gl_item’)
for info in ls:
# 提取商品标题
title = info.find_element_by_css_selector(’.p-name.p-name-type-2 a’).text.strip()
print(‘title:’, title)
# 提取商品价格
price = info.find_element_by_css_selector(‘div.p-price > strong > i’).text.strip()
print(‘price:’, price)
# 提取店铺名称
shop = info.find_element_by_css_selector(‘span.J_im_icon > a’).text.strip()
print(‘shop:’, shop)
# 提取评价数据量
comments = info.find_element_by_css_selector(‘div.p-commit > strong > a’).text.strip()
print(‘comments:’, comments)
print(’=’ * 200)
# 翻页
time.sleep(random.random() * 2)
btn_next = driver.find_element_by_css_selector(‘a.pn-next’)
btn_next.click()

关闭浏览器

driver.close()

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值