selenium在python自动化的使用
作业:进去百度搜索“***”,然后点官网,进入“关于我们”页面,把页面里面信息取出来
import time
from selenium import webdriver
driver = webdriver.Chrome() #启动Chrome浏览器
driver.get("http://www.baidu.com")
driver.maximize_window() #浏览器放大
time.sleep(3)
print(driver.page_source)
driver.find_element_by_id('kw').send_keys('***') #输入关键字
driver.find_element_by_id('su').click() #点击搜索按钮
time.sleep(3)
driver.find_element_by_id("1").find_element_by_tag_name("a").click() #打开搜索的第一条链接
time.sleep(3)
driver.switch_to.window(driver.window_handles[1])
# hand = driver.window_handles
# driver.switch_to.window(hand[1])
driver.find_element_by_xpath('//*[@id="nav_view_navigator_38_843"]/li[2]/h3/a').click()
url_page = driver.current_url # 获取当前页面的URL
title_page = driver.title # 获取当前页面的title
name_browser = driver.name # 获取当前浏览器的名称
source_html = driver.page_source # 获取当前页面的html源码
print("当前页面的URL: " + url_page)
print("当前页面的title: " + title_page)
print("当前浏览器的名称: " + name_browser)
print("当前页面的html源码: " + source_html)
还有一种用requests的方法 这里需要在python里面下载requests插件
import requests
url = 'http://www.***.com/gywm'
r = requests.get(url)
r.encoding = r.apparent_encoding
print(r.text)