Python爬虫之表单和登录窗口采集

  Python自带的urllib库实现了HTTP基本的GET功能,当我们想要实现比GET更多的事情时,那么就需要去寻找支持Python标准的第三方库了。
  Requests库可以成为你的选择,它可以处理复杂的HTTP请求,cookie,header等内容,是一个第三方库。
  可以使用Python包管理器,执行命令pip install requests安装Requests库。
  浏览器的地址栏让我们可以进行GET请求,而网页上的表单则方便我们进行POST请求。
  利用Python代码模拟网页上表单提交时,我们需要通过form标签的action获取到进行post请求的地址,然后找到form表单中有name属性的输入域,这些输入域即是我们进行post请求需要传递的数据。下面是一个提交基本表单的例子。

简单表单提交

  我们看到过网页上最简单的表单应该是这样的

<form method="post" action="/login.action">
用户名:<input type="text" name="username" /><br>
密码:<input type="password" name="passwd" /><br>
<input type="submit" value="提交"
  • 1
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值