爬虫

1 url管理器,把获取的url放进来
2 url内容下载器,下载url列表里面的内容
3 解析url,用到beautifulsoup,网页基础
4 存储数据

2url获取
简单的静态网页获取的基本代码
rest=requests.get() 获得一个response对象
print(response.text) 获得response对象里面的内容。
https://blog.csdn.net/qq_39241986/article/details/80721717
(1)Get是向服务器发索取数据的一种请求;而Post是向服务器提交数据的一种请求,要提交的数据位
于信息头后面的实体中。GET和POST只是发送机制不同,并不是一个取一个发.
(2)GET请求时其发送的信息是以url明文发送的,其参数会被保存在浏览器历史或web服务器中,而post则不会某(这也是后面我们翻页的时候发现拉勾网翻页时 浏览器 url栏地址没有变化的原因。)

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值