如何在一周内学会爬虫?本文详解,百分之九十的人都能用这个学习计划学会

LLand520

于 2020-09-24 14:21:42 发布

阅读量320

点赞数

文章标签： python 编程语言

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/LLand520/article/details/108773373

版权

python爬虫如何学习?汇集众多程序员学习经验总结出的爬虫最适合大多数人的学习路线分享!

爬虫的一周学习计划：
下图是爬虫的准备

在这里插入图片描述

爬虫爬取快代理案例：
网站的url=“https://www.kuaidaili.com/free/”

这次爬取我们采用的是requests第三方库
Requests 是一个 Python 的 HTTP 客户端库,我们可以用它得到HTML源码

import requests
url=“https://www.kuaidaili.com/free/”
headers={
“User-Agent”: “Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/84.0.4147.105 Safari/537.36”
}
#这里进行了头部的伪装
res=requests.get(url,headers=headers)
res.encoding=“utf-8”
html=res.text

之后我们用xpath实现标签的遍历获取到我们需要的内容

e=etree.HTML(html)
ip_list=e.xpath("//tr/td[1]/text()")
port_list=e.xpath("//tr/td[2]/text()")
#采用zip迭代的方式打印输出
for ip,port in zip(ip_list,port_list):
str=“ip:”+ip+"\t端口号："+port
print(str)

小结
本文主要讲解了网络爬虫的结构和应用，以及Python实现爬虫的案例。希望大家对本文中的网络爬虫工作流程和Requests实现HTTP请求的方式重点吸收消化。

这里是引用最后，小编想说：我是一名python开发工程师，整理了一套最新的python系统学习教程，想要这些资料的可以关注私信小编“01”即可（免费分享哦）希望能对你有所帮助.

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。