python访问陌生人qq空间_在Python中使用Phantomjs模拟登录QQ空间

一、问题来源

在使用Python进行数据爬取的过程中,我们一般使用Selenuim自动化测试工具对需要进行登录验证和动态JS数据的站点进行爬取。而与Selenuim相对应的浏览器组件,为了方便起见,一般使用FireFox或Chrome。

网上有一些关于模拟登录QQ空间的方法,都是使用Selenuim+Firefox或其他浏览器,例如郑晓的这篇:http://www.zh30.com/python-selenium-qzone-login.html

但Firefox或Chrome的内存占用极大,调用也会耗费一定的时间,有时候在机器性能有限的情况下,一旦访问量频繁,则会影响爬虫效率。

二、使用PhantomJS

幸而,我们还可以使用Phantomjs这个基于WebKit的服务器端 JavaScript API无头浏览器来进行模拟登录,代码如下:

from selenuim import webdriver

# 设置Phantonjs路径

driver = webdriver.Phantomjs(executable_path="D:\\phantomjs.exe")

login_url = 'https://h5.qzone.qq.com/mqzone/index'

driver.get(login_url)

time.sleep(3)

# 点击“继续打开触屏版”

driver.execute_script("var q=document.getElementById('guideSkip');q.click()")

driver.implicitly_wait(3)

# 填写登录信息

driver.find_element_by_id('u').clear()

driver.find_element_by_id('u').send_keys('QQ')

driver.find_element_by_id('p').clear()

driver.find_element_by_id('p').send_keys('密码')

# 登录

driver.execute_script("var login=document.getElementById('go');login.click();")

driver.implicitly_wait(3)

# 获取Cookie

cookie = driver.get_cookies()

因为在Phantomjs中,click()方法对于一些标签不是、的按钮无效,而QQ空间触屏版中的按钮大多数都不是标签,例如”继续打开触屏版”为标签,“登录”为

标签。

所以在调用FireFox等浏览器中直接click()的方式不行,只得在driver中调用execute_script()方法,执行一段JS的点击事件,以进行跳转。

最后,使用get_cookies()方法,获取QQ空间登录后的Cookie。

模拟登录成功之后,既可以继续在Phantomjs上直接进行数据爬取,也可以保存下Cookie,利用Cookie进行其他操作,就看个人取舍了。

分享到:

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值