python post请求实例_Python爬虫的post请求简单实例

本文介绍了如何使用Python的urllib库进行POST请求,包括解析网页表单信息,设置请求头模拟浏览器行为,以及如何递交注册信息。同时,讲解了如何设置代理服务器,从http://www.xicidaili.com/获取代理地址,并在请求中应用。此外,还提到了调试日志的打印方法,帮助理解请求过程。
摘要由CSDN通过智能技术生成

登陆网页注册时用Python进行post请求,代码

首先查看页面源代码,注意form表单部分,哪里是需要递交的表单信息

277526

运行代码

import urllib.request

import urllib.parse

url='http://www.iqianyue.com/mypost'

postdata=urllib.parse.urlencode({'name':'chenkehk','pass':'316107'}).encode('utf-8')#用字典保存索要注册的信息并用urlencode编码,使用encode()设置utf-8编码格式

r=urllib.request.Request(url,postdata)

r.add_header('User-Agent','Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/45.0.2454.101 Safari/537.36')#模仿浏览器爬取,添加包头信息

data=urllib.request.urlopen(r).read()

f=open('D:/AuI18N/1.html','wb')

f.write(data)

f.close()

成功爬取网页并自动递交表单信息,完成post请求

关于代理服务器的设置

可以到http://www.xicidaili.com/这个地方找

代码:

import urllib.request

import urllib.parse

def u(p_add,url):

p=urllib.request.ProxyHandler({'http':p_add})#设置代理服务器信息,

openr=urllib.request.build_opener(p,urllib.request.HTTPSHandler)#构造一个对象,参数是代理信息和urllib.request.HTTPSHandler类

urllib.request.install_opener(openr)#创建全局默认的openrd对象

data=urllib.request.urlopen(url).read().decode('utf-8')#打开网址,爬取内容

return data

p_add='111.155.116.240:8123'

data=u(p_add,'http://www.baidu.com')

print(len(data))

Debuglog日志,在爬取网页的同时打印调试日志,代码:

import urllib.request

import urllib.parse

httphd=urllib.request.HTTPHandler(debuglevel=1)

httpshd=urllib.request.HTTPSHandler(debuglevel=1)

openr=urllib.request.build_opener(httphd,httpshd)

urllib.request.install_opener(openr)

data=urllib.request.urlopen('http://edu.51cto.com')

如何查找登陆界面的,用户名密码字段,以下为例

在构造表单是可以建一个字典

{

"username":"chenkehao"

"password":"1111"

}

然后递交表单即可

277526

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值