python抓取网页

python取网页非常简单,但是python自带的urllib和urllib2包爬取网页比较慢,但对爬取数据不多的话这个包还是挺好用的,对于爬取数据较多的可以选择一些扩展包。这里就只接单的介绍一下urllib2这个包的使用:

 

import urllib2
def fetch(url):
    http_header={'User_Angent':'CHrome'}
    http_request=urllib2.Request(url,None,http_header)

    print "Start downloading data... "
    http_response=urllib2.urlopen(http_request)
    print"Finish downloading data..."
    # Status code
    #200  /ok
    #404 /Invalid URL
    #500 /Internal Error

    print http_response.code

    #http.header(key/value pairs)

    print http_response.info()

    print"-------Data------"
    print http_response.read()

if __name__=="__main__":
   fetch("http://bj.meituan.com/") 


运行完这段代码你就能看到结果,赶紧试试吧。。。

注:python3以上的版本不支持urllib2

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值