爬虫基础——罗静

最新推荐文章于 2023-08-04 06:45:00 发布

钱与快乐齐消失

最新推荐文章于 2023-08-04 06:45:00 发布

阅读量199

点赞数

文章标签：爬虫 python 开发语言

本文链接：https://blog.csdn.net/m0_64181803/article/details/123464850

版权

1，爬虫入门程序

#导入功能库 urllib2
import urllib2

#调用urllib2库的urlopen方法第一个参数url即为URL
response = urllib2.urlopen("http://www.baidu.com")

#response 对象有一个 read 方法，可以返回获取到的网页内容。
print response.read()

2，爬虫程序添加data，header，然后post请求

#导入功能库库名 urllib urllib2
import urllib
import urllib2

#填写地址url
url = 'http://www.server.com/login'
#设置Headers 的参数
user_agent = 'Mozilla/4.0 (compatible; MSIE 5.5; Windows NT)'
#设置data 参数是访问URL时要传送的数据
values = {'username' : 'cqc', 'password' : 'XXXX' }
#设置Headers 的属性
headers = { 'User-Agent' : user_agent }
#对data数据进行编码
data = urllib.urlencode(values)
#进行请求
request = urllib2.Request(url, data, headers)
#进行访问
response = urllib2.urlopen(request)
#返回

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

钱与快乐齐消失

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
爬虫基础——罗静

1，爬虫入门程序#导入功能库 urllib2import urllib2#调用urllib2库的urlopen方法第一个参数url即为URLresponse = urllib2.urlopen("http://www.baidu.com")#response 对象有一个 read 方法，可以返回获取到的网页内容。print response.read()2，爬虫程序添加data，header，然后post请求#导入功能库库名 urllib urllib2 import ...
复制链接

扫一扫