Pythone爬虫学习入门一

Pythone爬虫学习

入门案例

首先确定好请求对象

import requests  #导入requests包
url ='http://www.baidu.com'
strhtml = requests.get(url)  #Get方式获取网页数据
print(strhtml.text)  #strhtml 是url对象,但是使用.text就表示是网页源码
urlilb2.rulopen()

response =urllib2.rulopen(url,data,timeout)

  • url 即URL 必须填
  • data,默认为None
  • timeiout 超时时间 默认为socket_GLOBAL_DEFAULT_TIMEOUT

执行这个urlopen方法之后,返回的是一个response对象,返回的信息都保存在这里面

response有一个read方法,可以获取到网页的内容

其实url还可以被封装在request中 例如:request=urllib2.Request(url) 再将reqeuest作为参数放到rulopen方法中

推荐使用这种方式,因为在构建请求的时候i还需要加入很多内容,通过构建一个request,服务器响应请求得到应答,这样才显得逻辑清晰


POST和GET数据传输
#`post` 
import urllib
import urllib2
values={
   "username":"[email protected]","password":"xxx"}
data=urllib.urlencode(values)
url="http://xxxxx"
request =urllib2.Request(url,data)
response=urllib2.urlopen(reqest)
print response.read()

#get
values=[]
values['usernaem']="[email protected]"
values['password']="xxxx"
data=urllib.urlencode(values)
url="http://xxxxx"
geturl
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值