Python 获取 html 网页内容

一篇基础文章,不讲爬虫。单纯的获取标签元素的值、操作网页。
用到了 selenium 包。 这个包需要给浏览器安装驱动,不同的浏览器需要的驱动不同。环境搭建参考:https://blog.csdn.net/weixin_36279318/article/details/79475388
需要注意,windows版本的驱动文件.exe需要放在python.exe所在的目录下,环境变量才能生效(别问我为什么,我也不知道 (✪ω✪))
在这里插入图片描述

代码:

from selenium import webdriver
from selenium.webdriver.common.action_chains import ActionChains
from time import sleep

# 打开火狐浏览器
browser=webdriver.Firefox()

# 打开百度首页
browser.get("https://www.baidu.com/")

# 获取'新闻'超链接中的文字 3种方法
print(browser.find_element_by_name("tj_trnews").text)
print(browser.find_element_by_xpath("//*[@name='tj_trnews']").text)
print(browser.find_element_by_css_selector("div#u1 > a")[1].text)

# 在输入框输入'hello world'
browser.find_element_by_id("kw").send_keys("hello world")

# 点击'百度一下'按钮
browser.find_element_by_id("su").click()

# 清除搜索框内容
browser.find_element_by_id("kw").clear()

# 调用js代码
js="alert('hello world');"
browser.execute_script(js)

# 关闭浏览器
sleep(1)
browser.quit()
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值