一、准备
1.Python2.7 下载地址:https://www.python.org/downloads/
2.PyCharm 下载地址:http://www.jetbrains.com/pycharm/download/
免费注册地址:http://idea.lanyus.com/
3.phantomJS 下载地址:http://phantomjs.org/download.html
4.selenium 安装:pip install selenium
不会安装pip的可以看我之前的博客 :http://blog.csdn.net/junmoxi/article/details/63687785
二、编码
目标网址:爬虫论坛
#coding:utf-8
from selenium import webdriver
from selenium.webdriver.support.ui import WebDriverWait # WebDriverWait的作用是等待某个条件的满足之后再往后运行
import time
import sys
driver = webdriver.PhantomJS(executable_path='D:\phantomjs\phantomjs.exe') # 构造网页驱动
driver.get('http://www.cncrawler.com/forum.php') # 打开网页
driver.find_element_by_xpath('//*[@id="ls_username"]').send_keys('你的用户名')
driver.find_element_by_xpath('//*[@id="ls_password"]').send_keys('你的密码')
#driver.get_screenshot_as_file('验证码.jpg') # 截取当前页面的图片
#input_solution = input('请输入验证码 :') 手工打码
#driver.find_element_by_xpath('//input[@name="captcha"]').send_keys(input_solution)
#time.sleep(2)
driver.find_element_by_xpath('//*[@id="lsform"]/div/div/table/tbody/tr[2]/td[3]/button').click() # 表单的提交 表单的提交,即可以选择登录按钮然后使用click方法,也可以选择表单然后使用submit方法
sreach_widonw = driver.current_window_handle # 用来定位当前页面
# driver.find_element_by_xpath('//button[@class="sign-button submit"]').click()
try:
dr = WebDriverWait(driver,5)
#dr.until(lambda the_driver: the_driver.find_element_by_xpath('//a[@class="zu-side-login-box"]').is_displayed())
if driver.find_element_by_xpath('//*[@id="um"]/p[1]/strong/a'):
print('登录成功')
except:
print('登录失败')
driver.save_screenshot('screen_shoot.jpg') #截取当前页面的图片
sys.exit(0)
driver.quit() #退出驱动