- 以下是一个使用Python实现简单自动化的示例代码,该代码使用selenium库来自动化执行Google搜索并返回搜索结果的标题和URL
# 导入需要的库
from selenium import webdriver
from selenium.webdriver.common.keys import Keys
# 创建一个WebDriver对象,启动Chrome浏览器
driver = webdriver.Chrome()
# 访问Google搜索页面
driver.get("https://www.google.com/")
# 找到搜索框元素并输入关键词
search_box = driver.find_element_by_name("q")
search_box.send_keys("Python automation")
# 模拟按下Enter键进行搜索
search_box.send_keys(Keys.RETURN)
# 等待搜索结果加载完成
driver.implicitly_wait(10)
# 找到所有的搜索结果元素,并输出标题和URL
search_results = driver.find_elements_by_css_selector("div.g")
for result in search_results:
title = result.find_element_by_css_selector("h3").text
url = result.find_element_by_css_selector("a").get_attribute("href")
print(title)
print(url)
# 关闭浏览器
driver.quit()
- 导入
selenium
库和selenium.webdriver.common.keys
模块。 - 创建一个
WebDriver
对象,指定使用Chrome浏览器。 - 使用
driver.get()
方法访问Google搜索页面。 - 使用
driver.find_element_by_name()
方法找到搜索框元素,使用send_keys()
方法输入关键词。 - 使用
Keys.RETURN
模拟按下Enter键进行搜索。 - 使用
driver.implicitly_wait()
方法等待搜索结果加载完成。 - 使用
driver.find_elements_by_css_selector()
方法找到所有的搜索结果元素。 - 对于每个搜索结果,使用
result.find_element_by_css_selector()
方法找到标题和URL元素,并分别使用text
和get_attribute()
方法获取它们的文本内容和链接地址。 - 使用
print()
函数输出搜索结果的标题和URL。 - 使用
driver.quit()
方法关闭浏览器。
- 这个代码片段可以用来自动执行简单的网络爬虫任务,通过模拟用户在浏览器中的操作来实现数据的抓取。