Python爬虫 - 登录csdn

使用urllib2BeautifulSoupCookieJar实现登录.

使用charles抓包找到post的login网址: https://passport.csdn.net/account/login

再来看看post的参数:

哎呀这里的密码竟然是明文..

username、password和_eventId好说,只是lt和execution在哪里获得呢?

我们来看一下紧挨着的GET请求返回的html代码,这里竟然还有注释哇哇:

好,那么现在总结一下 步骤:

  1. https://passport.csdn.net/account/login进行get请求,在html代码中获得lt和execution;
  2. 表单创建
  3. 带上POST表单,进行POST请求

代码如下:

获取 lt

要使用Python爬虫登录CSDN,你可以按照以下步骤进行操作: 1. 导入必要的库,如selenium和webdriver。 2. 下载并安装Chrome浏览器,并下载对应版本的chromedriver.exe。 3. 设置webdriver的路径,并启动Chrome浏览器。 4. 使用webdriver打开CSDN登录页面。 5. 定位到用户名和密码的输入框,使用send_keys()方法输入你的用户名和密码。 6. 定位到登录按钮,并使用click()方法进行点击。 7. 等待登录成功后,你可以根据需要进行进一步的数据爬取或其他操作。 以下是一个示例代码,你可以参考该代码进行操作: ```python from selenium import webdriver # 设置chromedriver的路径 chrome_driver_path = "path_to_chromedriver.exe" # 启动Chrome浏览器 browser = webdriver.Chrome(executable_path=chrome_driver_path) # 打开CSDN登录页面 browser.get("https://passport.csdn.net/login") # 定位到用户名和密码输入框,并输入你的用户名和密码 username = browser.find_element_by_id("username") password = browser.find_element_by_id("password") username.send_keys("your_username") password.send_keys("your_password") # 定位到登录按钮,并点击 login_button = browser.find_element_by_class_name("logging") login_button.click() ``` 请注意,这只是一个简单的示例代码,你可能还需要处理一些其他的细节,如验证码等。另外,为了避免对CSDN服务器造成过大的负载,请确保你的爬虫行为合法,并遵守相关网站的使用协议。
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值