selenium爬虫学习记录

魔装木偶

已于 2022-10-28 20:59:32 修改

阅读量174

点赞数

文章标签： selenium 爬虫学习

于 2022-10-07 10:04:16 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_40980058/article/details/127191137

版权

conda安装后需要安装对应的浏览器驱动
#页面加载与关闭方式

def start_crawler():
    url = "http://www.cjh.com.cn/sqindex.html"
    # 浏览器设置
    option = webdriver.FirefoxOptions()
    option.add_argument('--headless')  # 设置静默模式
    # 打开firefox浏览器
    browser = webdriver.Firefox(options=option)
    # print('加载主页...')
    browser.get(url)
    # 退出浏览器
    browser.quit()

火狐浏览器的驱动geckodriver会遗留日志文件，可以用os进行删除

os.remove("geckodriver.log")

#标签定位与点击
应该是xpath方式最好用，批量获取标签也可以，获得list

info = browser.find_elements(By.XPATH, '//*[@id="sssqold"]/tr[*]')

标签点击
定位后直接调用该元素的click方法

browser.find_element(By.XPATH, '//*[@id="btn"]').click()

#选择框
定位后调用select_by_visible_text或者select_by_index方法
#填写文本

browser.find_element(By.XPATH, "path").send_keys("你要输入的文本内容")#输入内容

slctSea = Select(browser.find_element(By.XPATH, '//*[@id="ddl_sea"]'))
slctYear = Select(browser.find_element(By.XPATH, '//*[@id="ddl_year"]'))
slctYear.select_by_visible_text(year)
slctSea.select_by_index(seaIdx)

#获取文本内容
使用text

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
selenium爬虫学习记录

学习
复制链接

扫一扫

魔装木偶 CSDN认证博客专家 CSDN认证企业博客

码龄7年

9: 原创

65万+: 周排名

157万+: 总排名

5488: 访问

: 等级

97: 积分

1: 粉丝

2: 获赞

3: 评论

11: 收藏

私信

关注

热门文章

分类专栏

论文笔记 1篇
知识图谱 1篇

最新评论

windows bat脚本开conda跑python
MessiGodLike: 还可以这样，我擦，弯路走多了。感谢！
使用uiautomator2控制安卓手机
1.105: 大佬连接手机usb连接跟wifi连接还有其他方式吗uiautomator2 百度了两种连接手机的方式 1数据线连接 2wifi连接还有其他的吗比如说我后端代码部署在阿里云的云服务器我用后端接口调用然后uiautomator2操作手机做一些操作

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。