前言: 本文涉及知识点有数据库的读写,python基础,浏览器开发者工具的使用,适用于有编程基础,了解过python的朋友阅读。
环境:PyCharm+Chrome+MongoDB Window10
爬虫爬取数据的过程,也类似于普通用户打开网页的过程。所以当我们想要打开浏览器去获取好友空间的时候必定会要求进行登录,接着再是查看说说。那么我们先把登录步骤给解决了。
1.模拟登录QQ空间
因为想更直观的看到整个登录过程所以就没有用selenium+phantomjs,而是结合Chrome使用。除了slenium和Chrome之外还需要下载ChromeDriver进行使用,官网不提供win64版本的但是win32版本的也能正常在64位系统使用 我使用的是 2.30版本的ChromeDriver和61的Chrome
from selenium import webdriver
from selenium.webdriver.common.by import By
def Start_Login():
driver = webdriver.Chrome(executable_path='D:\\phantomjs-2.1.1\\bin\\chromedriver.exe') #这个是chormedriver的地址
driver.get('https://qzone.qq.com/')
driver.switch_to.frame('login_frame')
driver.find_element_by_id('switcher_plogin').click()
driver.find_element_by_id('u').clear()<