关于爬虫

最新推荐文章于 2021-09-04 20:40:30 发布

LI ZHI XIN

最新推荐文章于 2021-09-04 20:40:30 发布

阅读量77

点赞数

分类专栏：笔记

本文链接：https://blog.csdn.net/qq_45995001/article/details/117574716

版权

笔记专栏收录该内容

17 篇文章 0 订阅

订阅专栏

Python爬虫
1.什么是爬虫
爬虫，即网络爬虫，大家可以理解为在网络上爬行的一直蜘蛛，互联网就比
作一张大网，而爬虫便是在这张网上爬来爬去的蜘蛛咯，如果它遇到资源（文字，
图片、视频），那么它就会抓取下来

2.爬虫的步骤
（1）哪里爬：网络资源，URL；整个网页上所有数据
（2）爬什么：我们需要的。
（2）怎么爬：非常强大的正则表达式，以及许多开源库（urllib
库,BeautifulSoup(BS)）

3.URL的一些常识
file:///Users/songchunmin/Desktop/q.jpg
https=http+ssl
https://www.baidu.com/
文本：用电脑记事本可以打开文件
超文本：文本，视频，音频，HTML，css文件。。。
超文本传输协议
协议://域名/路径-》URL(URI)地址

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

LI ZHI XIN

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
关于爬虫

十六、Python爬虫16.1什么是爬虫爬虫，即网络1.什么是爬虫爬虫，即网络爬虫，大家可以理解为在网络上爬行的一直蜘蛛，互联网就比作一张大网，而爬虫便是在这张网上爬来爬去的蜘蛛咯，如果它遇到资源（文字，图片、视频），那么它就会抓取下来2.爬虫的步骤（1）哪里爬：网络资源，URL；整个网页上所有数据（2）爬什么：我们需要的。（2）怎么爬：非常强大的正则表达式，以及许多开源库（urllib库,BeautifulSoup(BS)）3.URL的一些常识file:///Users/songc
复制链接

扫一扫