#完全模拟浏览器的操作,很难被反爬虫手段检测到
1,selenium自带了IE和Firefox的驱动程序,可以直接使用, 但是其他比如Chrome浏览器是没有自带驱动的,需要下载,
#不过我的火狐浏览器也下载了geckodriver驱动,并且放在了python的安装目录下,火狐还添加了系统路径
·2,启动浏览器
①Firefox浏览器
form selenium import webdriver
driver=webdriver.Firefox()#无需添加路径
driver.get('https.wwww.baidu.com/')
html=driver.page_source#获取网页源码
②Chrome浏览器(自行配置)
form selenium import webdriver
driver=webdriver.Chrome('D:\python3.7\scripts\chromedriver.exe')#驱动放在python安装的该目录下
driver.get('https.wwww.baidu.com/')
html=driver.page_source#获取网页源码
chromedriver最好放在python中的script文件夹下
3,浏览器的各种模拟操作
·find_element_by_id()-----通过ID的属性定位
find_element_by_name()------通过name属性定位
find_element_by_tagName()------通过标签名称定位
find_element_by_className()------通过class属性定位