爬虫的基本流程

最新推荐文章于 2024-04-23 19:15:00 发布

Shao0000

最新推荐文章于 2024-04-23 19:15:00 发布

阅读量2k

点赞数 1

分类专栏：爬虫 python 文章标签：爬虫 python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_42903932/article/details/84666813

版权

python 同时被 2 个专栏收录

55 篇文章 0 订阅

订阅专栏

14 篇文章 0 订阅

订阅专栏

1、发起请求：

通过url向服务器发起request请求，请求可以包含额外的header信息。

2、获取响应内容：

如果服务器正常响应，那我们将会收到一个response，response即为我们所请求的网页内容，或许包含HTML，Json字符串或者二进制的数据（视频、图片）等。

3、解析内容：

如果是HTML代码，则可以使用网页解析器进行解析，如果是Json数据，则可以转换成Json对象进行解析，如果是二进制的数据，则可以保存到文件进行进一步处理。

4、保存数据：

可以保存到本地文件，也可以保存到数据库（MySQL，Redis，Mongodb等）

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
爬虫的基本流程

1、发起请求：通过url向服务器发起request请求，请求可以包含额外的header信息。2、获取响应内容：如果服务器正常响应，那我们将会收到一个response，response即为我们所请求的网页内容，或许包含HTML，Json字符串或者二进制的数据（视频、图片）等。3、解析内容：如果是HTML代码，则可以使用网页解析器进行解析，如果是Json数据，则可以转换成Json对象进行...
复制链接

扫一扫

专栏目录

Shao0000 CSDN认证博客专家 CSDN认证企业博客

码龄6年

58: 原创

11万+: 周排名

150万+: 总排名

2万+: 访问

: 等级

854: 积分

6: 粉丝

5: 获赞

1: 评论

22: 收藏

私信

关注

热门文章

分类专栏

新的开始
Matplotlib 8篇
atplotlib
python 55篇
爬虫 14篇
Django 8篇
Flask 13篇
Tornado 10篇
MySQL 1篇
数据库 1篇
再学爬虫 2篇
疑难杂症 1篇
Vue 5篇
部署 2篇
数据分析 1篇

最新评论

Flask---用原生sql操作：
AngelStaw: [code=python] from flask_sqlalchemy import SQLAlchemy from flask import Flask def showHtml(tId,bTime,oTime): app = Flask(__name__) app.config['SQLALCHEMY_DATABASE_URI'] = 'mysql+pymysql://root:19368756@127.0.0.1:3306/MPFA' db = SQLAlchemy(app) items = db.session.execute("select id,time from attendence") return tId+"aa" [/code] 能不能看一下我的代码哪里错了？我执行到db.session.execute就报错，但是我不知道怎么显示更多报错信息，只是提示代码执行有错误。

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。