不跳步骤的新手python爬虫教程(二)

本文是Python爬虫系列教程的第二部分,涵盖了HTTP与HTTPS的基础知识,请求行和请求头的解析,并详细介绍了如何使用requests模块进行GET和POST请求。文章强调实践,鼓励读者跟随步骤操作,通过实际编码提升爬虫技能。
摘要由CSDN通过智能技术生成

    代码不是看出来的,而是敲出来的,欢迎关注公众号,收藏教程,跟着步骤练习爬虫,成为真正的Spider Man。 

   在第一篇教程里(不跳步骤新手python爬虫教程(一))我们学习了安装python、运行python、下载IDE: Pycharm(代码编辑器)以及浏览器的网络请求等相关知识内容,下面紧接着开始爬虫第二篇教程的学习。

步骤一:认识http、https

    HTTP:超文本传输协议。以明文形式传输,效率高,不安全。而HTTPS:HTTP+SSL(安全套接字层)。SSL证书需要购买申请,功能越强大的证书费用越高。传输数据前先加密,接收数据后解密获取内容,效率低,更安全。http用的是80端口,而https用的是443端口。http报文格式如下图:

步骤二:请求行与请求头

    在Headers里面我们可以看到当前请求网址

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值