- 博客(60)
- 收藏
- 关注
原创 Python 标准库之 random 模块
Python 的random模块提供了生成伪随机数的工具,可用于模拟随机过程、生成测试数据、实现随机化算法等场景。
2025-06-16 08:43:40
449
原创 Python 标准库之 math 模块
函数功能floor向下取整ceil向上取整pow指数运算fabs绝对值sqrt开平方modf拆分小数和整数fsum计算列表中所有元素的累加和copysign复制符号pi圆周率e自然对数。
2025-06-14 08:47:37
584
原创 Python 中常用的标准库系列之 sys 模块
sys模块是 Python 标准库中最常用的模块之一,它提供了许多与 Python 解释器和系统环境交互的功能。通过sys模块,你可以访问命令行参数、解释器版本、内存使用情况以及执行环境等关键信息。下面是syssys模块是 Python 标准库中最基础、最常用的模块之一,它提供了与解释器和系统环境交互的核心功能。掌握sys模块对于编写健壮的 Python 程序至关重要,特别是在处理命令行参数、标准流重定向、内存管理和程序退出等场景中。建议在实际开发中多多使用sys模块,并查阅官方文档以了解更多高级功能。
2025-06-13 10:25:13
517
原创 Python 标准库之 os 模块
模块提供了与操作系统进行交互的功能,是 Python 标准库中最常用的模块之一。它允许开发者访问和操作文件系统、环境变量、进程管理等底层操作系统功能,使代码能够在不同平台上保持一致的行为。模块是 Python 与操作系统交互的基础工具,适用于文件系统操作、环境变量管理和进程控制。对于更高级的文件路径处理,推荐使用。掌握这些模块能显著提升代码的可移植性和健壮性。对于复杂的命令执行,推荐使用。
2025-06-12 11:31:43
365
原创 Python 中的命名空间
命名空间是 Python 实现变量隔离的核心机制,通过 LEGB 规则确保变量查找的优先级。合理使用命名空间可以提高代码的可维护性和可读性。
2025-06-11 09:31:49
717
原创 Python 标准库之 datetime 模块
timedelta 对象表示一个时间段,即两个日期 (date) 或日期时间 (datetime) 之间的差。
2025-06-10 09:44:44
1745
原创 Python 标准库之 Json 模块
"age": 12人有两个属性: name 和 age属性 name 的值为 “tom”属性 age 的值为 12。
2025-06-09 08:52:34
638
原创 Python 标准库之 random 模块介绍
模块是 Python 标准库中用于生成伪随机数的工具集,适用于模拟、游戏、抽样等场景。如需生成安全的随机数(如密码学场景),推荐使用。
2025-06-07 09:06:47
309
原创 Python 进阶应用教程:Python 标准库之 math 模块
函数功能floor向下取整ceil向上取整pow指数运算fabs绝对值sqrt开平方modf拆分小数和整数fsum计算列表中所有元素的累加和copysign复制符号pi圆周率e自然对数。
2025-06-04 09:02:56
624
原创 Python 中常用的标准库系列之 sys 模块
模块是 Python 标准库中非常基础且重要的模块,提供了与解释器和系统交互的核心功能。以上只是一些常见用法,实际使用中还可以根据需求探索更多功能。模块提供了许多与 Python 解释器和系统环境相关的功能。提前终止程序,可指定退出码(0 表示正常退出,非零表示异常)。获取命令行参数,返回一个列表,第一个元素是脚本名。:获取和设置 Python 解释器的递归最大深度。:查看和修改 Python 模块的搜索路径。:获取 Python 版本、路径等信息。:重定向标准输入输出,操作。在 Python 中,
2025-06-03 08:58:46
736
原创 Python 标准库之 os 模块
模块提供了与操作系统进行交互的功能。这个模块让你可以使用操作系统相关的功能,而不需要担心具体的操作系统类型(如 Windows、Linux 或 macOS)。模块是 Python 标准库中最常用的模块之一,掌握它可以让你更高效地处理文件系统和系统级操作。
2025-06-01 09:07:37
386
原创 Python 中的模块
函数接口功能描述fabs计算绝对值sin正弦函数cos余弦函数sqrt求平方根在下面的小节,将使用 math 模块作为例子讲解 Python 中模块的语法。模块定义了函数 max、函数 min 和变量 PI,它们是模块提供的接口主程序使用模块的接口函数和导出变量PI = 3.14if a > b:return aelse:return bif a < b:return aelse:return b在第 1 行,定义了模块的导出变量 PI。
2025-05-30 09:00:08
1712
原创 Python 中的异常处理
程序读文件内容的过程可能会发生错误,例如:要读取的文件不存在。传统的错误处理方式如下:例如,在 C 语言中,函数 open 用于打开一个文件,它的声明如下: 参数 path 指定要打开的文件; 参数 mode 指定打开文件的方式:只读、读写; 函数返回一个整数,该整数作为文件的标识符; 如果打开文件成功,则返回一个非负的整数; 如果打开文件失败,则返回 -1。 因此,通过检查函数 open 的返回值,即可以判断 open 是否成功,示例如下: 在第 1 行,函数
2025-05-30 08:57:28
741
原创 Python 中的错误和异常
创建继承自Exception的类:pythonsuper().__init__(f"无效的邮箱地址: {email}")try:print(e) # 输出: 无效的邮箱地址: example.com6. 最佳实践精确捕获异常:避免使用裸except,应指定具体异常类型。日志记录:记录异常信息,便于调试。资源管理:使用with语句自动释放资源(如文件、网络连接)。异常链:使用保留原始异常信息。pythontry:raise RuntimeError("处理数据失败") from e。
2025-05-29 14:08:24
554
原创 Python 中的生成器实现原理
生成器是 Python 中实现迭代器的优雅方式,它通过yield关键字自动管理状态,避免了显式实现迭代器类的复杂性。简洁的语法自动状态保存惰性求值,节省内存支持无限序列为协程提供基础理解生成器的实现原理,能帮助你编写出更高效、更具 Pythonic 风格的代码。
2025-05-28 10:19:45
367
原创 Python 类的继承和多继承
在面向对象的程序设计中,定义一个新的 class 的时候,可以从某个现有的 class 继承,新的 class 称为子类,而被继承的 class 称为基类、父类或超类。Python 中继承的语法如下: 在第 1 行,定义了父类 Parent; 在第 4 行,定义了子类 Child,语法 Child(Parent) 表示类 Child 继承于类 Parent。子类继承父类的属性和方法,使得子类具有父类的属性和方法,从而实现代码重用;同时,子类可以增加自己特有的方法。例如,下图中定义了 3 个类
2025-05-27 15:19:18
741
原创 Python 类的私有属性和私有方法
在第 3 行,创建一个私有属性。start,表示开始位置end,表示结束位置length,表示线段的长度,等于 end - start当修改属性 start 时,属性 length 会发生变化;当修改属性 end 时,属性 length 也会发生变化;在第 2 行,定义构造方法在第 5 行,使用属性 start 和 end 计算属性 length在第 7 行,定义方法 show,打印属性 start、end、length。
2025-05-27 15:17:19
757
原创 Python 类的构造方法、析构方法、实例方法
class 类:def 实例方法(self):self.属性实例方法定义在类中,它的第一个参数 self 指向调用该方法的对象,在实例方法中通过 “self.属性” 访问对象的实例属性。class 类:def __init__(self, 参数):self.属性 = 参数对象 = 类(参数)在第 2 行,在类中定义了一个方法 __init__,该方法被称为构造方法方法名的前缀和后缀是两个下划线 _方法的第一个参数 self 指向新创建的对象方法的其余参数用于设定对象的属性。
2025-05-26 11:56:39
1046
原创 Python 的对象和类概念
在Python中,使用class关键字定义类。类的定义包括属性和方法。属性用于描述对象的状态,而方法用于定义对象的行为。创建对象是通过调用类的构造方法__init__来实现的。例如:在这个例子中,Dog类定义了两个属性(name和age)和一个方法(bark通过调用Dog类,创建了dog1对象,并可以访问其属性和方法。
2025-05-22 13:58:23
187
原创 Python 原生爬虫教程:使用 Pytesseract 进行简单的验证码识别
在爬虫开发中我们经常会遇到一种反爬虫的手段就是验证码,那么如何才能绕过验证码拿到我们想要的数据呢?这节课我给大家介绍一个。Pytesseract 是 Python 中专门用来识别验证码和字符的常用第三方模块,它是一个根据 Google 开发的 Tesseract 包进行独立封装的产物。由于它在识别验证码方面具有得天独厚的优势,所以经常被爬虫开发程序员用来进行识别验证码。本节课我们就来使用 pytesseract 进行简单的验证码的识别。
2025-05-21 09:47:11
458
原创 Python 原生爬虫教程:数据清洗
理想中,我们获取的数据都是一样的格式,可是现实中,会有许多脏数据,有时候是数据太冗余,有时候是数据缺失,有时候是同一种类数据拥有不同的数据格式。比如生日,有的人使用阿拉伯数字,有的人使用英文简写,有的人则是加入了中文字符。如果只是简单的某一列数据问题,我们可以写一个脚本进行处理,可是,当数据太复杂,数据量太大,我们自己编写脚步就太浪费时间和精力了。有没有什么可视化工具,可以像操作Excel表格很方便的对数据进行分类,排序清洗那?有问题,肯定会有解决问题的方案。
2025-05-21 09:45:37
569
原创 Python 原生爬虫教程:数据可视化
爬虫只是我们获取数据的第一步,我们最终的目的是要让数据服务于人类,因此,我们需要Numpy,Pandas 等数据分析工具分析数据,然后使用 matplotlib 工具来绘制可视化图形,从而让我们的数据更加生动,更加被一般用户所理解和使用。在我们开始的我们的可视化的之旅之前,需要简单的介绍一些数据分析工具,我们的数据可视化的任务也是建立在数据分析的基础之上。除了简单的二维图形,同样,matplotlib 也可以很轻松的绘制三维图形,上面的代码就是我们绘制三位图形的简单版本。首选,我们来画一张最基本的直方图。
2025-05-21 09:27:32
358
原创 Python 原生爬虫教程:爬虫和反爬虫
有的时候,当我们的爬虫程序完成了,并且在本地测试也没有问题,爬取了一段时间之后突然就发现报错无法抓取页面内容了。这个时候,我们很有可能是遇到了网站的反爬虫拦截。我们知道,网站一方面想要爬虫爬取网站,比如让搜索引擎爬虫去爬取网站的内容,来增加网站的搜索排名。另一方面,由于网站的服务器资源有限,过多的非真实的用户对网站的大量访问,会增加运营成本和服务器负担。因此,有些网站会设置一些反爬虫的措施。我们只有认识了主要的反爬虫措施,才能识别反爬虫措施,从而进行反反爬虫。
2025-05-20 14:26:16
753
原创 Python 原生爬虫教程:Redis 的简单使用和配置
Redis是一个开源的内存数据结构存储系统,常用于缓存、消息队列和数据存储。任务队列(存储待爬取的 URL)去重集合(记录已爬取的 URL)分布式锁(协调多节点爬虫)安装 Redis(以 Ubuntu 为例):bash# 安装Redis服务器# 启动Redis服务# 验证服务状态Python 客户端安装bash。
2025-05-20 14:24:55
534
原创 Python 原生爬虫教程 :MongoDB 数据库的简单使用和配置
你可以使用 MongoDB 的命令行工具或任何 GUI 工具(如 Robo 3T 或 MongoDB Compass)来查看数据是否已经正确存储。这样,你就完成了一个简单的 Python 爬虫,并将数据存储到了 MongoDB 中。你可以根据需要调整爬虫逻辑和数据处理方式。以下是一个简单的爬虫示例,该爬虫从某个网页抓取数据,并存储到 MongoDB 中。(用于 MongoDB 的操作)。确保你已经安装了 MongoDB,并且它正在运行。首先,确保你的 Python 环境中安装了。(用于解析 HTML)和。
2025-05-19 11:40:22
351
原创 Python 爬虫基础教程:正则表达式页面提取
通过以上代码和技巧,你可以快速搭建一个简单的网页爬虫。对于复杂网站结构,建议结合使用 BeautifulSoup 库进行更高效的内容提取。
2025-05-19 10:52:57
424
原创 Python 原生爬虫教程:BeatifulSoup 的使用
BeautifulSoup(简称 BS4)是 Python 的 HTML/XML 解析库,能将网页文本转换为树形结构,方便快速定位和提取数据。支持多种解析器(如lxml),兼容性强。
2025-05-16 10:08:47
376
原创 Python 原生爬虫教程:使用 Xpath 进行爬虫开发
Xpath( XML Path Language, XML路径语言),是一种在 XML 数据中查找信息的语言,现在,我们也可以使用它在 HTML 中查找需要的信息。既然谈到 Xpath 是一门语言,当然它就会有自己的一些特定的语法。我们这里罗列一些经常使用的语法,熟悉下面的基本语法之后,就能满足我们日常的爬虫开发所用。
2025-05-16 09:57:17
855
原创 Python 原生爬虫教程: requests 第三方库
requests是 Python 中最流行的 HTTP 请求库,相比原生的urllib更简洁易用。处理各种 HTTP 请求(GET/POST/PUT/DELETE 等)自动处理 URL 编码、JSON 解析会话保持(自动管理 Cookie)超时设置、代理、SSL 验证等高级功能安装方式bash模拟浏览器行为,避免被网站识别为爬虫:pythonWin64;q=0.9,*/*;q=0.8',
2025-05-14 08:53:07
814
原创 Python 原生爬虫教程:HTTP 的请求和响应
以上就是 Python 原生爬虫中 HTTP 请求和响应的基础教程。掌握这些知识后,你可以进一步学习 HTML 解析(如使用 BeautifulSoup 库)和高级爬虫技术(如异步请求、分布式爬虫)。HTTP 协议是爬虫的核心,请求由客户端(如浏览器或 Python 程序)发送到服务器,响应则是服务器返回的数据。Python 内置的。
2025-05-14 08:49:39
415
原创 ThinkPHP 控制器的使用
在 ThinkPHP 中,控制器一般存放在目录下。下面是一个简单控制器的示例:phpThinkPHP 控制器是应用的核心组成部分,它负责处理业务逻辑并返回响应。通过合理运用控制器的特性,如依赖注入、中间件、RESTful 支持等,可以让代码更加简洁、可维护。
2025-05-13 09:48:25
427
原创 ThinkPHP 路由的使用
在 ThinkPHP 里,路由的定义一般是在文件中完成的。1.简单路由php// 定义GET请求路由// 定义POST请求路由// 定义多种请求类型路由// 定义任意请求类型路由2.路由参数php// 必需参数// 可选参数(使用问号)// 多个参数3.路由分组借助路由分组能够对路由进行归类管理,还能为分组内的路由统一设置前缀、中间件等属性。php。
2025-05-13 09:44:49
558
原创 Python 原生爬虫教程:HTTP 协议通信基原理
HTTP 是我们进行爬虫的一个基础之一,我们通过 HTTT 协议才能顺利爬取到 HTML 里面的内容,HTTP 相当于是一条道路,HTML 等网页是道路的终点,我们必须遵守 HTTP 的交通规则,才能高效的在这条道路上运输数据。
2025-05-11 09:19:49
529
原创 Python 原生爬虫教程:HTML 与 CSS 基础入门
正所谓,知己知彼,百战不殆。我们爬虫的爬取对象,就是各式各样的网页,只有对网页的基本内容达到熟悉的程度,才能顺利的书写我们的爬虫程序。
2025-05-11 09:17:48
341
原创 Python 原生爬虫教程:网页基本构成和抓取原理
在抓取网页时,还需要注意遵循网站的使用条款和法律法规,避免对网站造成过大的负担或进行非法的抓取行为。同时,一些网站可能会采取反爬措施,如设置验证码、限制 IP 访问频率等,爬虫开发者需要采取相应的策略来应对这些反爬机制。
2025-05-11 09:15:18
326
原创 Python 的闭包简介
Python 中的闭包(Closure)是一种特殊的函数,它捕获并保存了外部作用域中变量的绑定,即使外部函数已经执行完毕,这些变量的值也会被闭包记住。闭包在函数式编程、装饰器、回调函数等场景中非常有用。闭包由以下三部分组成:关键点:闭包会保留外部变量的状态,即使外部函数已经执行结束。python解析:动态生成函数:python2. 装饰器在不修改原函数的前提下增加功能:python3. 回调函数在异步编程中保存状态:python闭包的注意事项 变量捕获时机:闭包捕获
2025-05-09 09:22:21
394
原创 Python 的 lambda 表达式
lambda 表达式是 Python 中定义简单匿名函数的便捷工具,适合快速编写一次性的、轻量级的函数。但对于复杂逻辑,建议使用普通函数以保持代码的可读性和可维护性。
2025-05-09 09:11:02
438
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人