python 模拟用户点击浏览器_python模拟用户浏览器登陆网站

【前置条件】

Python 2.7.13 |CentOS release 6.5

方案一:使用urllib2库

首先使用自己的账号和密码在浏览器登录,然后通过抓包拿到cookie,再将cookie放到请求之中发送请求即可,具体代码如下:

# -*- coding: utf-8 -*-

import urllib2

# 构建一个已经登录过的用户的headers信息

headers = {

"Host":"www.renren.com",

"Connection":"keep-alive",

"Upgrade-Insecure-Requests":"1",

"User-Agent":"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/54.0.2840.99 Safari/537.36",

"Accept":"text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,*/*;q=0.8",

"Accept-Language":"zh-CN,zh;q=0.8,en;q=0.6",

# 添加抓包获取的cookie,这个Cookie是保存了密码无需重复登录的用户的Cookie,里面记录了用户名及密码等登录信息(我这里只显示一部分)

"Cookie": "anonymid=jpj3x8dl3bucfp; depovince=BJ; _r01_=1; jebe_key=03bdf34f-49ca-4aba-abff-d6552c90711e%7Ccfcd208495d565ef66e7dff9f98764da%7C1544494102650%7C0; jebecookies=1bca8ed4-b76b-4c5e-a599-ce7c2112f0cd|||||; JSESSIONID=abcZvYrHBc6em41wacBEw; ick_login=6c5bdd5d-b553-44be-a851-33b5130b4c69; _de=B5B94B4549137285E481BC4A8D8B28816DEBB8C2103DE356; p=783f97b6a51eea1dc5ee76b1e1a2a1702; first_login_flag=1; ln_uact=****; ln_hurl=http://hdn.xnimg.cn/photos/hdn421/20130628/1430/h_main_c7bN_86290000032f113e.jpg; t=395e99e55de1ae9abca18e8e05b612702; societyguester=395e99e55de1ae9abca18e8e05b612702; id=245451152; xnsid=64f44934; loginfrom=syshome"

}

# 通过headers里的报头信息(主要是Cookie信息),构建Request对象

request = urllib2.Request("http://www.renren.com/", headers = headers)

# 直接访问renren主页,服务器会根据headers报头信息(主要是Cookie信息),判断这是一个已经登录的用户,并返回相应的页面

response = urllib2.urlopen(request)

# 打印响应内容

print response.read()

request = urllib2.Request("http://www.renren.com/226003000/profile?v=info_timeline", headers = headers)

response = urllib2.urlopen(request)

print response.read()

方案二selenium+phantomjs模拟浏览器登录:

linux没有成功,windows实验成功

# -*- coding: utf-8 -*-

from selenium import webdriver

from selenium.webdriver.common.keys import Keys

import time

driver = webdriver.PhantomJS(executable_path=r'F:\tools\phantomjs-2.1.1-windows\bin\phantomjs.exe')

driver.get("http://www.renren.com/")

# 输入账号密码

driver.find_element_by_name("email").send_keys("用户名")

driver.find_element_by_name("password").send_keys("密码")

# 模拟点击登录

driver.find_element_by_xpath("//input[@class='input-submit login-btn']").click()

# 等待3秒

time.sleep(3)

# 生成登陆后快照

driver.save_screenshot("renren.png")

【异常1】

Traceback (most recent call last):

File "loginsp.py", line 2, in

from selenium import webdriver

ImportError: No module named selenium

解决方法:

F:\workspace\python>pip install selenium

【异常2】

os.path.basename(self.path), self.start_error_message)

selenium.common.exceptions.WebDriverException: Message: 'phantomjs' executable n

eeds to be in PATH.

解决方法:

下载phantomjs.exe,解压后在代码中配置具体路径:

【官网地址】http://phantomjs.org/download.html

方案三:selenium+chromedriver实现模拟登陆

模拟登陆:job.cdeledu.com

# -*- coding: utf-8 -*-

from selenium import webdriver

from selenium.webdriver.common.keys import Keys

import os

import time

chromedriver = "C:/Program Files (x86)/Google/Chrome/Application/chromedriver"

os.environ["webdriver.chrome.driver"] = chromedriver

driver = webdriver.Chrome(chromedriver) #模拟打开浏览器

url = "http://job.cdeledu.com"

driver.get(url) #打开网址

driver.maximize_window()

# 输入账号密码

#driver.find_element_by_class_name(name)

driver.find_element_by_id("username").send_keys("username")

#注意,下面这一步非常关键,浪费了好多脑细胞,此行代码解决下面异常的关键代码

driver.find_element_by_id("plainCode").click()

driver.find_element_by_id("password").send_keys('password')

time.sleep(3)

driver.find_element_by_xpath("//a[@class='loginSubmit']").click()

【官方网址】http://chromedriver.storage.googleapis.com/index.html

异常1:selenium.common.exceptions.ElementNotVisibleException: Message: element not interactable

解决方案:见源代码

浏览器版本:chrome68.0.3440.106

https://dl.lancdn.com/landian/software/chrome/m/?utm_sources=DownPageBot

异常2:selenium-server打开chrome提示chromedriver.exe已停止工作

版本问题。

各位网友大家好,要运行此工具必需先设置好网页信息,点击菜单栏设置或用快捷键(Alt+E)进入到设置页面,设置页面其中包括三个Tab:基本配置、网页信息和数据库。基本配置:如果要运行页面点击时自动刷新外网IP就要配置ADSL帐号,现在暂时只支持ADSL刷新外网IP。单独页面执行是已Html中div的id为标志,意思是循环只执行此选中项,默认是所有项目。IP数据表就是每执行一下点击网页都会记录下本次的IP,记录文件放在此工具的路径下的Data目录下的iptables.log文件,最小化启动程序就是启动此工具或最小化窗口后台托管运行,就像QQ一样挂着。循环重启软件运行此项是为了和刷新ADSL一起配合产生独立IP,因为每个浏览器都有Cookies,关闭浏览器就可以彻底清除Cookies产生独立访客(UV)了。如果同时选择了最小化启动程序可以用全局快捷键Ctrl+Alt+空格解除循环。网页信息:是一个表格可以进行添加、修改和删除。页面执行方式有两种:一是completed意思是等网页加载完毕后执行点击,二是thread多线程执行意思是加载页面3秒钟后再执行页面点击。各有各自的优点,如果发现其中一种执行方式实现不了可以用另外一种试一下。类型就是网页的链接返回类型,有两种一时纯url链接如:http://www.baidu.com,另一种是数据库SQL语句返回链接集。用数据库名加@加地址标志,在数据库Tab中配置。SQL语句一定要返回link结果集如:select concat('http://www.google.com/', url) link from table,在SQL语句中不要用双引号,要用单引号,否则会出错。现在支持MYSQL和MSSQL数据库。链接就是类型对应的文本。htmlID是html中div的id,这个是网站网页中要点击的定位点,是这个表的主键必须唯一。偏移坐标就是htmlID的相对偏移点,用英文逗号隔开如0,0。状态有两种Y和N,意思是是和否,默认是Y,就是如果您想停用此条记录不加入循环就改为N。独立IP,默认是N,就是在Data/iptables.log文件中没出现过的当为独立ip。双击单元格可以修改文本内容。点击最后的删除可以删除此行记录。修改或添加后可别忘记了按右下角的保存按钮哦。数据库tab表格简单明了就不多加说明了。如果有出现运行异常可以可以查看Data下的error.log错误日志文件。如果对此工具有何意见或建议可以点击意见反馈发送你的宝贵信息。此工具支持在线更新。如收到您的来信,我会尽快的修改更新。温馨提示:目标执行标签(htmlID)要保持在预览窗口显示,建议最大化窗口最小化后台托管运行。希望此工具可以帮得了大家。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值