【超详细】QQ空间说说爬取教程(看看你的女神在想什么~

【超详细】QQ空间说说爬取教程


暑假闲来无事,研究了一下QQ空间的爬取,以下是一些记录

环境

  • 系统: win10
  • 语言: python3.7
  • 浏览器: Chrome
  • 数据库: mysql 8.0

selenium模拟登录

QQ空间的反爬做的相对较好,而且由于好友权限的原因,我们要先登录后再进行说说等信息的获取

selenium是获取登录cookies的一大利器,非常方便

[外链图片转存失败(img-F3LVKTLU-1564936981762)(_v_images/1564893585_32236.png)]

在空间的登陆界面可以观察到,登录的窗口与背景窗口是分开的,所以我们需要先切换frame

切换窗口后定位到账号密码登录元素的位置后点击

[外链图片转存失败(img-em7yDL2z-1564936981763)(_v_images/1564894488_20108.png)]

使用send_keys函数把账号和密码写入对应位置后定位登录元素后点击,这里使用自带的get_cookies函数获取到cookies,但是这个cookies需要过滤一下,具体操作看以下代码

代码为类的部分节选,完整代码在最后,未声明的变量皆为类的成员变量

def login_func(self,z):
    browser = webdriver.Chrome()
    browser.maximize_window()
    browser.get(self.login_url)
    time.sleep(1.2)
    browser.switch_to.frame('login_frame')
    browser.find_element_by_id('switcher_plogin').click()
    time.sleep(1)
    browser.find_element_by_id('u').send_keys(self.number)
    browser.find_element_by_id('p').send_keys(self.password)
    time.sleep(1)
    browser
评论 11
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值