Python期末总结7

最新推荐文章于 2024-07-27 12:20:46 发布

狗熊岭第一深情

最新推荐文章于 2024-07-27 12:20:46 发布

阅读量2.5k

点赞数

文章标签： python 开发语言后端

本文链接：https://blog.csdn.net/L2462405313/article/details/122022913

版权

Python计算生态涵盖网络爬虫、数据分析、文本处理、数据可视化、图形用户界面、机器学习、Web开发、网络应用开发、游戏开发、虚拟现实、图形艺术等多个领域，为各个领域的Python使用者提供了极大便利。

网络爬虫程序涉及HTTP请求、Web信息提取、网页数据解析等操作，Python计算生态通过Requests、Python-Goose、Re、Beautiful Soup、Scrapy和PySpider等库为这些操作提供了强有力的支持，这些库各自的功能如表所示。

库名	功能说明
Requests	Requests提供了简单易用的类HTTP协议，支持连接池、SSL、Cookies，是Python最主要的、功能最丰富的网络爬虫功能库
Python-Goose	Python-Goose专用于从文章、视频类型的Web页面中提取数据
Re	Re提供了定义和解析正则表达式的一系列通用功能，除网络爬虫外，还适用于各类需要解析数据的场景
Beautiful Soup	Beautiful Soup用于从HTML、XML等Web页面中提取数据，它提供一些便捷的、Python式的函数，使用起来非常简单
Scrapy	Scrapy支持快速、高层次的屏幕抓取和批量、定时的Web抓取以及结构性数据的抓取，是一款优秀的网络爬虫框架
PySpider	PySpider也是一款爬虫框架，它支持数据库后端、消息队列、优先级、分布式架构等功能。与Scrapy相比，它灵活便捷，更适合小规模的爬取工作

关注