爬虫入门

最新推荐文章于 2024-07-09 15:58:38 发布

iteye_2035

最新推荐文章于 2024-07-09 15:58:38 发布

阅读量65

点赞数

文章标签：爬虫

本文链接：https://blog.csdn.net/iteye_2035/article/details/82648004

版权


import urllib
import urllib2

dic = {}
dic['name'] = 'Dick'
dic['age'] = 20

data = urllib.urlencode(dic)#编码，post的数据
request = urllib2.Request('http://baidu.com',data)#创建请求对象
responce = urllib2.urlopen(request)#打开网页，返回'响应'对象
the_page = responce.read()
print the_page


#有一些站点不喜欢被程序（非人为访问）访问
#这时候可以把自身模拟成Internet Explorer

user_agent = 'Mozilla/4.0 (compatible; MSIE 5.5; Windows NT)'

headers = { 'User-Agent' : user_agent }    
req = urllib2.Request(url, data, headers)

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

iteye_2035

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
爬虫入门

[code="python"]import urllibimport urllib2dic = {}dic['name'] = 'Dick'dic['age'] = 20data = urllib.urlencode(dic)#编码，post的数据request = urllib2.Request('http://baidu.com',data)#创建请求对象...
复制链接

扫一扫