用selenium 进行自动登录和首页信息和账号页

说明:本页并不是爬取数据 只是用selenium 进行网站自动登录(有验证码) 并获取一个网页所有的信息

from selenium import webdriver
import requests
url=’https://accounts.douban.com/login?alias=&redir=https%3A%2F%2Fwww.douban.com%2F&source=index_nav&error=1001
driver=webdriver.Chrome()

访问网址

driver.get(url)

响应的内容

response=driver.page_source

possword 对应的id 后面为input 中输入的内容

driver.find_element_by_id(‘password’).send_keys(‘xxx’)
driver.find_element_by_id(‘email’).send_keys(‘xxx’)

在pycharm 后端手动输入验证码的值

res=input(‘请输入验证码:’)

把后端输入的值传到里面进行输入

driver.find_element_by_id(“captcha_field”).send_keys(res)

给登录绑定一个单击事件

driver.find_element_by_class_name(“btn-submit”).click()

登录进去之后有些网页是需要cookie 才能登陆 获取到信息 否则什么也获取不到

cookie_selenium=driver.get_cookies()
cookies=[]
for i in cookie_selenium:
cookie=i[‘name’] +’=’+i[‘value’]
# print(cookie)
cookies.append(cookie)
cookie=’; ‘.join(cookies)
headers={
‘Cookie’:cookie,
“User-Agent”:’Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/68.0.3440.106 Safari/537.36’
}
url=’https://www.douban.com/accounts/
response1=requests.get(url,headers=headers)
with open(‘personsl.html’,’wb’) as ff:
ff.write(response1.content)

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值