python爬虫登录豆瓣_Python爬虫——爬豆瓣登录页面

最新推荐文章于 2023-10-07 15:48:26 发布

随波竹留

最新推荐文章于 2023-10-07 15:48:26 发布

阅读量452

点赞数

文章标签： python爬虫登录豆瓣

本文链接：https://blog.csdn.net/weixin_31107269/article/details/113672729

版权

直接上代码

import urllib.request

import http.cookiejar

from lxml import etree

# from spiderImg import getImg

head = {

‘Connection‘: ‘Keep-Alive‘,

‘Accept‘: ‘text/html, application/xhtml+xml, */*‘,

‘Accept-Language‘: ‘en-US,en;q=0.8,zh-Hans-CN;q=0.5,zh-Hans;q=0.3‘,

‘User-Agent‘: ‘Mozilla/5.0 (Windows NT 6.3; WOW64; Trident/7.0; rv:11.0) like Gecko‘

}

def makeMyOpener(head):

cj = http.cookiejar.CookieJar()

opener = urllib.request.build_opener(urllib.request.HTTPCookieProcessor(cj))

header = []

for key,value in head.items():

elem = (key,value)

opener.addheaders = header

return opener

oper = makeMyOpener(head)

uop = oper.open(‘https://accounts.douban.com/login‘, timeout = 1000)

data = uop.read()

html = data.decode()

spath = ‘./doubanLogin.html‘

f=open(spath,"w",encoding=‘utf-8‘)

f.write(html)

f.close()

print(html)

原文：http://www.cnblogs.com/wangyuhangboke/p/7827838.html

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

随波竹留

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

爬虫——豆瓣登录

都市的背包客____博客

05-10

371

import urllib.request from selenium import webdriver from PIL import Image import re import time url = 'http://accounts.douban.com/login' email = input('E-mail:') password = input('Password:') brows...

爬虫之豆瓣登录界面

Im ok的博客哦

07-03

2017

在对豆瓣的登录界面进行爬取的时候会发现，豆瓣的登录界面并不是第一次就加载出来的，而是在首次请求过后进行了二次请求。因此我们用普通的静态方式是无法获取有关登录界面的任何信息的。所以就需要使用selenium来帮助获取动态。豆瓣的登录界面可以明显看出是二次请求。 import time,requests from selenium import webdriver from lxml import...

参与评论您还未登录，请先登录后发表或查看评论

豆瓣爬虫模拟用户登录

01-02

代码主要实现了基于豆瓣平台的爬虫，模拟用户登录，不需手动登录，模拟登录实现了验证码的获取，将验证码获取到本地保存以图片的形式，用户在本地查看图片输入即可实现登录，并爬取个人中心数据。使用时需要修改spider目录下的db.py文件中的邮箱与密码，修改为正确的邮箱及密码。

爬虫实战4：豆瓣的模拟登陆

A994958的博客

12-07

1625

系列文章目录一、pandas是什么？二、使用步骤 url_basic = 'https://accounts.douban.com/j/mobile/login/basic' url = 'https://www.douban.com/' ua_headers = {"User-Agent": 'Mozilla/4.0 (compatible; MSIE 8.0; Windows NT 6.0; Trident/4.0)'} # basic中p..

模拟登录豆瓣（python爬虫）

加辣椒了吗?的博客

11-21

2007

模拟登录豆瓣使用selenium和time两个库，不考虑需要验证码的情况。步骤如下： 1.首先进入豆瓣首页 2.模拟点击密码登录 3.模拟输入账号密码 4.模拟点击登录 5.进入页面，运行结果为True。代表登录成功，账号信息在网页源代码中！代码如下：其中使用css类选择器寻找元素（密码登录，账号输入框，密码输入框，登录豆瓣） from selenium import webdriver import time # 缺少验证码的情况 url = "https://www.douban.co

python 爬虫豆瓣复联4_爬虫python_爬虫_python爬虫_

10-04

对于初学者来说，这个项目不仅可以帮助掌握Python爬虫的基本操作，还能锻炼数据处理和文件操作的能力。随着技能的提升，可以尝试更复杂的爬虫项目，如模拟登录、动态加载页面的处理等，进一步提升自己的编程技能。在...

10-03

本项目聚焦于使用Python语言实现一个专门针对豆瓣电影影评的爬虫，以便收集并分析用户对热门电影的评价。在这个过程中，我们将涉及Python的基础知识，网络请求，HTML解析以及数据存储等多个关键知识点。首先，...

豆瓣_爬虫_爬虫excel_豆瓣；爬虫；top250；python_

09-29

标题中的“豆瓣_爬虫_爬虫excel_豆瓣；爬虫；top250；python_”表明这个项目是关于使用Python爬虫技术从豆瓣网站抓取数据，并将抓取到的数据整理成Excel表格的实践案例。关键词“top250”意味着爬取的是豆瓣电影评分...

基于python爬虫对豆瓣影评分析进行爬取的课程设计.zip

12-08

在本课程设计中，我们将深入探讨如何利用Python爬虫技术来获取并分析豆瓣电影网站上的影评数据。Python爬虫是获取大量网络数据的有效手段，尤其适用于数据分析和挖掘项目。以下是一些关键知识点： 1. **Python基础*...

comment_爬虫_xpath_豆瓣电影_python_影评_

09-29

标题中的"comment_爬虫_xpath_豆瓣...综上所述，本项目涉及了Python爬虫技术，通过XPath解析HTML，抓取豆瓣电影的用户长评，为电影数据分析提供基础素材。具体的实现细节可以通过分析`comment.py`的代码来进一步了解。

详解python 模拟豆瓣登录（豆瓣6.0）

01-01

最近在学习python爬虫，看到网上有很多关于模拟豆瓣登录的例子，随意找了一个试了下，发现不能运行，对比了一下代码和豆瓣网站，发现原来是豆瓣网站做了修改，增加了反爬措施。首先看下要模拟登录的网站：打开开发者模式：在账号和密码随意填入数据：发现会发送一个post请求： ur是:https://accounts.douban.com/j/mobile/login/basic 数据格式是: 于是可以来编写代码： import requests def main(): url_basic = 'https://accounts.douban.com/j/mobile/logi

python爬虫豆瓣网的模拟登录实现

09-18

主要介绍了python爬虫豆瓣网的模拟登录实现，文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值，需要的朋友们下面随着小编来一起学习学习吧

python爬虫模拟登录网页：登录豆瓣网

mostermoonsky的博客

02-22

1471

登录账号都是post请求，我们第一反应是从源码中找登录表单的action属性但有些页面或登录组件是js脚本得通过故意错误登录后查看真正发送post请求的链接上代码： import requests url1 = 'https://accounts.douban.com/j/mobile/login/basic' url2 = 'https://www.douban.com/' header ...

python爬虫登录豆瓣（二）

unique 的博客

10-13

697

之前使用 requests 库普通登录了豆瓣，这次为带验证码登录。（故意几次使用错误的帐号和密码登陆可以出现验证码登录，也因此这次请求时需要提交 cookies，说明之前几次密码是错误的）同上一篇的过程一样，能过 chrome 浏览器抓包，提交 header、data以及 cookies。由于这次需要抓取验证码图片，因此使用了 bs4 库的 BeautifulSoup 类，同时使用

Python爬虫——爬豆瓣登录页面

weixin_30675247的博客

11-13

直接上代码 import urllib.request import http.cookiejar from lxml import etree # from spiderImg import getImg head = { 'Connection': 'Keep-Alive', 'Accept': 'text/html, application/xhtml+...

Python爬虫(二十二)_selenium案例：模拟登陆豆瓣