python爬虫知识梳理——requests库的使用

requests库是如此的简洁好用,以至于爬虫神器。

我也用过urllib2,保持了python的文件操作的接口,使用操作过文件、数据库之类的,使用urllib2会感到很熟悉,但是不可否就是繁琐。

我也用过scrapy,高度抽象了爬虫的编写流程,以框架的形式提供,讲道理,在我用习惯了requests之后,每次想要尝试scrapy都半途而废。

 

requests的使用手册有官方文档,支持中文,链接直达

 

在这里只说一下常用的两个请求函数,get、post

resp  = requests.get("https://www.baidu.com")
resp  = requests.post("https://www.baidu.com", data={"hello": "world"})

是不是惊呆了!

其实get和post函数的参数有很多,可以定制请求头、可以携带cookie,可以指定代理,等等等,在应付反爬虫的时候可以说是又灵活有强大

 

新开公众号“码家村”,欢迎关注

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值