python-requests+beautifulSoup实现文本和图片爬取网页爬虫

本文介绍了一个使用Python requests和BeautifulSoup库实现的简单网页爬虫,涵盖requests的基本用法、BeautifulSoup的解析技巧,并通过实例展示了如何爬取网页上的文字和图片。
摘要由CSDN通过智能技术生成

上周老师开会,突然就去承包了个商业项目,让我负责提供数据。所以最近任务就是---写爬虫

已经很久没有碰过爬虫了,这几天按照甲方的要求弄了一下下~

发现不涉及到登陆的爬虫做起来还是比较简单滴,特此记录一下下。

关于要登陆的网站,比如微博,人人网之类的爬虫,涉及到模拟登陆之类的知识点的详情请见我的另一篇文章啦~

https://blog.csdn.net/qq_40589051/article/details/98368420

本爬虫的实现用的工具包是 python requests+beautifulsoup,本文只记录了我使用到的部分,其他的功能还是得看官方文档哟!

------目录-------

1 requests用法

2 beautifulSoup用法

3 实例---爬取一个网页上的图片和信息

 

1 requests用法

requests是一个超级好用的http第三方库,用在爬虫和服务器客户端通信之类的项目上都很方便。

评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值