python爬虫（三）selenium爬取京东商品信息

最新推荐文章于 2024-07-25 19:59:32 发布

阿德罗斯

最新推荐文章于 2024-07-25 19:59:32 发布

阅读量7.2k

点赞数 4

分类专栏： python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_37393071/article/details/81409976

版权

本文主要介绍了使用selenium模拟浏览器操作爬取京东商品信息的过程。在实践中遇到了页面加载不完全和元素定位的问题，通过滚动加载和检查元素属性解决了这些问题。虽然对selenium有了初步理解，但对网页结构的掌握还需加强。

摘要由CSDN通过智能技术生成

目录

一、代码目的

二、准备工作

四、过程中遇到的坑

1.加载不完全

2.元素位置的确定

五、实验结果和总结

一、代码目的

主要是为了学习selenium模拟浏览器操作的方法

二、准备工作

浏览器：chrome

驱动：chromedirver（和python.exe在同一目录）

用到的库：lxml、selenium

三、代码

import time
from selenium import webdriver
from selenium.webdriver.support import expected_conditions as EC
from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import WebDriverWait

from lxml import etree

browser = webdriver.Chrome()
browser.get("https://www.baidu.com")

wait = WebDriverWait(browser,50)
def search():
	browser.get('https://www.jd.com/')
	try:
		input = wait.until(
			EC.presence_of_all_elements_located((By.CSS_SELECTOR,"#key"))
		)#llist
		submit = wait.until(
			EC.element_to_be_clickable((By.CSS_SELECTOR,"#search > div > div.form > button"))
		)
		#input = browser.find_element_by_id('key')
		input[0].send_keys('python')
		submit.click()

		total = wait.until(
			EC.presence_of_all_elements_loc

最低0.47元/天解锁文章

关注

4
点赞
踩
34

收藏

觉得还不错? 一键收藏
打赏
9
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

阿德罗斯 CSDN认证博客专家 CSDN认证企业博客

码龄8年

北京嘀嘀无限科技有限公司

74: 原创

4万+: 周排名

2万+: 总排名

10万+: 访问

: 等级

1580: 积分

137: 粉丝

189: 获赞

24: 评论

336: 收藏

私信

关注

分类专栏

阅读 6篇
消息队列 1篇
go 1篇
git 1篇
数据库 1篇
java 19篇
Leetcode 16篇
前端
Datawhale 3篇
Data
codewars java练习 11篇
python 14篇
scikit-learn 机器学习 1篇
生活 1篇

最新评论

「阅读」数据密集型系统设计第七章事务
CSDN-Ada助手: 不知道 MySQL入门技能树是否可以帮到你：https://edu.csdn.net/skill/mysql?utm_source=AI_act_mysql
「阅读」数据密集型系统设计第七章事务
CSDN-Ada助手: 不知道 MySQL入门技能树是否可以帮到你：https://edu.csdn.net/skill/mysql?utm_source=AI_act_mysql
消息队列-消息队列保证消息可靠性的一些建议
CSDN-Ada助手: MySQL入门技能树或许可以帮到你：https://edu.csdn.net/skill/mysql?utm_source=AI_act_mysql
python 爬虫实战：掘金文章爬取并保存在 mysql
挥洒寂寞: 怎么找不到接口乐
python 爬虫实战：掘金文章爬取并保存在 mysql
summe_blue: 掘金现在的API变了，具体某个文章的内容好像不是通过API接口返回的，而是服务端渲染，而且渲染后还做了混淆，不好爬啦。。。我用node.js的request-promise模块拉取数据，然后用cheerio分析DOM，找了半天找不到文章的内容，然后看API也没有，就很奇怪。。。

最新文章

目录

评论 9

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

阿德罗斯 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。