小小白爬虫入门——selenium模拟登录qq空间

第一次写爬虫是因为想要爬小伙伴空间的说说和留言,结果卡在了验证码。目前还没有解决自动输入验证码的问题。遇到了一下一些问题:
1.火狐浏览器需要下载geckodriver
2.登录表单在frame中,需要切换
3.切换后,要返回默认的主文档(是为了进行下一步操作,比如爬取当前页面的说说内容或定位当前页面的一些元素)

#coding=utf-8

import time
from selenium import webdriver
import sys
# 使用的火狐浏览器
driver = webdriver.Firefox()
# 要进入的空间url
driver.get("https://user.qzone.qq.com/1597872870")
# 登录表单在一个新的frame下,要先切换到这个frame,不然找不到账号密码的输入控件
driver.switch_to_frame('login_frame')
driver.find_element_by_id('switcher_plogin').click()
driver.find_element_by_id('u').clear()
driver.find_element_by_id('u').send_keys('qq账号')
driver.find_element_by_id('p').clear()
driver.find_element_by_id('p').send_keys('qq密码')
time.sleep(3)
driver.find_element_by_id('login_button').click()
# 好像有时候需要输入验证码,暂停20秒手动输入验证码
time.sleep(20)
driver.switch_to.default_content()

算是挖了一个坑,慢慢开始填坑吧。写这个爬虫已经好久了,一直想着写博客记录,但是毁于拖延症。第一次写,中间遇到的问题其实还挺多,但是,时间长…就忘了。下篇就写,如何爬取空间留言板的内容吧。先立个flag。

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值