java 爬虫模拟登陆CSDN详解(模拟表单登陆)

借鉴了许多网上的东西终于搞懂了,其实理念很简单,就是用代码向表单中提交数据,这时候需要分析需要提交什么,账户?密码?就没了嘛,不,当然不,还需要一下其他的东西,这些东西,因不同的网站而不同,

第一步:分析页面结构

我们要模拟CSDN用户表单登录,来获取用户登录后的数据。 
在一些网站和论坛,部分内容总是需要会员用户等需要一定权限的用户才能看得到。 
好了由此可见模拟用户表单登录的重要性了。

进入登录页,在页面上按F12查看页面元素的内容。 

这次我们只要form标签,和其内部的账号密码输入框信息。

第二步:讲解一下Post需要的操作具体流程

一般表单的id都是唯一的,所以要过滤出表单是很容易的一件事情 
这里表单的id值是fm1

List<Element> et = d1.select("#fm1");// 获取form表单

下一步是获得表单下面的帐号和密码输入框控件,同样可以根据id来过滤,不过这里使用的是name属性。 
一般网站设计都会把name属性配上value,po

  • 5
    点赞
  • 17
    收藏
    觉得还不错? 一键收藏
  • 13
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 13
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值