python
文章平均质量分 72
叶阿猪
这个作者很懒,什么都没留下…
展开
-
【python】DrissionPage库介绍
DrissionPage是一个基于Puppeteer的Python库,设计用于Web自动化和爬虫开发。它提供了一个简单易用的接口,允许你控制和操作无头或有头的Chrome或Chromium浏览器。DrissionPage的主要优势在于它能够处理现代Web页面的动态内容,这在传统静态网页抓取工具如Requests或BeautifulSoup中是难以实现的。原创 2024-07-03 17:22:24 · 603 阅读 · 0 评论 -
【python】pandas数据清洗(四):使用回归分析预测异常值
回归分析是一种统计方法,用于确定一个或多个自变量(X)与一个因变量(Y)之间的关系。在回归模型中,我们试图找到一个函数f,使得对于给定的自变量X,f(X)能够尽可能准确地预测因变量Y的值。回归方法包括但不限于线性回归、多项式回归、岭回归、Lasso回归和Elastic Net回归等。原创 2024-07-02 22:12:12 · 626 阅读 · 0 评论 -
【python】pandas数据清洗(三):修剪(Trimming)与顶底处理(Capping)详解
在数据分析和数据科学项目中,数据清洗是不可或缺的步骤,其目的是提高数据质量,使数据更加准确、一致和可靠。在数据清洗的过程中,处理极端值(也称为异常值或离群点)是一项关键任务。极端值可能是由测量误差、数据录入错误、系统故障或其他非正常情况导致的。这些值可能会扭曲数据分析的结果,因此需要特别注意。本文将持续介绍数据清洗的技巧。修剪是指直接从数据集中移除那些被识别为异常值的数据点。这种策略通常适用于数据集足够大,以至于删除少数几个极端值不会对总体统计特性产生显著影响的情况。原创 2024-07-02 21:57:23 · 483 阅读 · 0 评论 -
【python】pandas数据清洗(三):Z-Score 方法识别异常值
Z-Score,又称为标准分数,是统计学中用于表示一个值与数据集均值之间的偏差程度的一种度量。具体而言,Z-Score 是一个观测值减去均值后,再除以标准差的结果。Z-Score 可以告诉我们这个观测值在标准正态分布中处于什么位置。数学表达式如下:( X ) 表示单个观测值,( \mu ) 表示观测值所在样本的均值,( \sigma ) 表示样本的标准差。原创 2024-07-02 21:40:31 · 1555 阅读 · 0 评论 -
【python】pandas数据清洗(二):箱线图分析与IQR的深度解析
数据清洗的目标是识别并修正数据集中的错误、不一致或无关的信息,从而提高数据质量和分析结果的可靠性。其中,异常值的检测和处理是一项关键任务,而箱线图分析和IQR(四分位距)技术为此提供了强大的工具。IQR是衡量数据集中趋势以外部分的离散程度的一个重要指标,不受极端值的影响。因此,它是识别异常值的理想工具。通过理解箱线图的结构和IQR的计算方法,可以更加精确地检测数据集中的异常值,并采取适当的策略进行处理。通过上述步骤,不仅能够识别数据集中的异常值,还能有效清洗数据,提高后续数据分析的准确性和可靠性。原创 2024-07-02 21:29:15 · 468 阅读 · 0 评论 -
【python】pandas数据清洗(一)
在Pandas中进行数据清洗是非常重要的步骤,以确保数据分析的质量和准确性。本文将详细介绍如何使用, 和进行数据预处理。原创 2024-07-02 12:28:34 · 496 阅读 · 0 评论 -
【python】pandas数据统计:了解数据分布
本文主要介绍如何使用df.mean()df.sum()df.max(), 和df.min()。原创 2024-07-01 18:10:02 · 830 阅读 · 0 评论 -
【python】Pandas 中的.loc和.iloc介绍
在 Pandas 中,标签(labels)是指用来标识 DataFrame 或 Series 中行和列的唯一标识符。在 Pandas 的数据结构中,标签可以是任意哈希类型的对象,最常见的就是字符串和整数,但也可以是日期时间、元组等。标签在 DataFrame 中构成了行索引和列索引。原创 2024-07-01 17:37:50 · 428 阅读 · 0 评论 -
【python】pandas:DataFrame合并技巧详解
本文介绍了Pandas库中DataFrame合并的几种常用方法,包括基于键的合并(merge)、沿着轴合并(concat)、基于索引的合并(join)以及追加行(append)。本文将详细介绍Pandas库中DataFrame合并的几种常用方法,包括基于键的合并(merge)、沿着轴合并(concat)、基于索引的合并(join)以及追加行(append)。基于键的合并是最常用的DataFrame合并方法之一。它类似于SQL中的JOIN操作,可以根据两个DataFrame之间的共同列(键)进行合并。原创 2024-06-17 12:54:05 · 3005 阅读 · 1 评论 -
【python】pandas:自定义列名
在Pandas中读取文件时,可以通过以下两种方式自定义列名,本文以读取CSV文件为例。原创 2024-06-17 12:41:05 · 799 阅读 · 0 评论 -
【python】pandas:Series详解
Series是一个一维的、大小可变的、可以包含任何数据类型的数组,以及与之相关的一组数据标签(索引)。Series对象可以被看作是一个字典对象,其中包含了数组的数据和与这些数据相关联的索引。但与字典不同的是,Series中的索引是固定的,且是有序的。Series是Pandas库中的一个核心数据结构,用于处理一维数组型数据,并带有与之相关的数据标签(通常称为“索引”)。Series可以被视为一个固定大小的、有序的、可以包含任何数据类型的数组。原创 2024-06-17 08:50:31 · 1275 阅读 · 0 评论 -
【python】pandas:DataFrame详解
DataFrame是一个二维的表格型数据结构,它含有一组有序的列,每列可以是不同的值类型(数值、字符串、布尔型值等)。DataFrame可以被视为一个电子表格或SQL表,或是由多个Series对象组成的字典(这些Series对象共享一个索引)。原创 2024-06-17 08:40:44 · 1151 阅读 · 0 评论 -
【python】pandas常见文件读取方法
pandas是一个强大的Python数据分析库,它提供了多种读取文件的方法,支持多种文件格式。以下是pandas中常见的一些文件读取方法及其详细说明、常用参数、代码示例和数据示例。原创 2024-06-16 22:13:43 · 2459 阅读 · 0 评论 -
【python】assert断言
没有其它特殊的语法,但可以使用逻辑运算符(如 and、or、not)和比较运算符(如 ==、!=、、=)来构建更复杂的条件表达式。通常用于检查不应该发生的条件,或者在函数/方法内部检查传入的参数是否符合预期。但是,在生产环境中,一般不会使用断言(可以通过Python的。但是,如果条件为假(即。比较常用的是在测试环境用做自动化接口测试断言,简单方便。是一个用于调试目的的语句,它用于检查一个条件是否为真。,那么在断言失败时,Python会抛出一个通用的。,而不包含任何额外的信息。原创 2024-06-13 12:15:51 · 290 阅读 · 1 评论 -
【python】作用域
在Python中,作用域(Scope)是变量、函数和类在程序中的可见区域。关键字来声明一个变量是全局的,但这通常应该谨慎使用。在模块顶层定义的变量和函数都位于全局作用域。全局作用域是在模块级别定义的变量的作用域。在函数内部,可以使用。原创 2024-06-10 22:26:41 · 508 阅读 · 0 评论 -
【python】面向对象编程的基本概念简述
面向对象编程(Object-Oriented Programming,简称OOP)是一种程序设计范型,它将现实世界中的事物抽象为“对象”,并使用类和对象等概念来设计程序和软件系统。OOP提高了代码的可重用性、可维护性和可扩展性。原创 2024-06-10 22:16:54 · 398 阅读 · 0 评论 -
【python】列表模拟栈
在Python中,可以使用列表(list)来模拟栈(Stack)的行为。栈是一种后进先出(LIFO, Last In First Out)的数据结构,其中元素只能在一端添加(称为push)和移除(称为pop)。原创 2024-06-10 22:12:15 · 397 阅读 · 0 评论 -
【python】列表模拟队列
使用Python的列表可以模拟队列的行为,包括入队、出队、检查队列是否为空和获取队列的大小等操作。然而,需要注意的是,对于大型队列,使用列表的pop(0)方法进行出队操作可能不是最高效的。在这种情况下,可以考虑使用来优化性能。原创 2024-06-10 22:03:48 · 477 阅读 · 0 评论 -
【python】复数详细讲解
复数是形如a + bi的数,其中a和b都是实数,i是虚数单位,满足i^2 = -1。这里的a被称为复数的实部,b被称为复数的虚部。原创 2024-06-09 22:32:13 · 276 阅读 · 0 评论 -
【python】时间和日期
Python的`datetime`模块提供了用于处理日期和时间的类和函数。主要类包括`datetime`、`date`、`time`、`timedelta`和`tzinfo`(与时区有关)。原创 2024-06-10 21:55:15 · 702 阅读 · 0 评论 -
【python】os模块详解
Python 的 os 模块提供了与操作系统交互的功能。它提供了很多函数,用于读取或修改系统目录和文件、运行系统命令、处理系统环境变量等。原创 2024-06-10 21:40:18 · 1062 阅读 · 0 评论 -
【python】推导式
在Python中,推导式(Comprehension)是一种简洁、高效的方式来创建列表(list)、集合(set)、字典(dict)和元组(tuple)等数据结构。推导式允许你在一行代码中创建这些数据结构,通过迭代一个或多个可迭代对象并应用某种函数或表达式。原创 2024-06-09 23:35:11 · 253 阅读 · 0 评论 -
【python】基本数据类型:字符串(String)
在Python中,字符串是一种数据类型,用于存储文本信息。Python中的字符串是不可变的,即一旦创建了一个字符串,就不能修改它。但是,可以通过连接、切片和替换等操作来创建新的字符串。原创 2024-06-09 23:22:40 · 1064 阅读 · 0 评论 -
【python】科学计数法
科学计数法(Scientific Notation)是一种表示非常大或非常小的浮点数的方法。科学计数法允许我们以更简洁的方式表示这些数字,特别是在涉及大量计算或数据处理时。在 Python 中,可以直接以科学计数法的形式输入和输出浮点数。原创 2024-06-09 22:45:00 · 2164 阅读 · 0 评论 -
【python】基本数据类型:Number(数字)
Python3 中常见的数据类型Number(数字)。Python3 支持 的Number(数字)类型有int、float、bool、complex(复数)。原创 2024-06-09 22:27:16 · 348 阅读 · 0 评论 -
【python】类方法和静态方法的区别
在Python中,类方法和静态方法是两种与类相关联的特殊方法,它们提供了在类级别上执行操作的能力,而不仅仅是实例级别。类方法常用于在类的所有实例之间共享数据或行为,而静态方法则通常用于实现与类相关的功能,但不需要访问实例变量或实例方法。原创 2024-06-07 12:55:15 · 1164 阅读 · 0 评论 -
【Python】将GMT时间转换为上海时区(CST)时间
在数据处理和网络编程中,经常需要将格林威治标准时间(GMT)转换为其他时区的时间。在Python中,我们可以利用。库)来进行这种时区转换。以下是一个详细的示例,展示如何将GMT时间转换为上海时区(CST,UTC+8)的时间。# 原始GMT时间字符串 gmt_time_str = "Thu, 06 Jun 2024 07:20:32 GMT" # 将字符串转换为GMT时间(注意:这里我们假设GMT就是UTC) gmt_time = datetime.strptime(gmt_time_str原创 2024-06-06 16:23:36 · 502 阅读 · 0 评论 -
【python】类里面可以定义哪几种方法?
在Python中,类是一个用于创建对象的模板或蓝图。类可以包含数据(属性)和方法,这些方法定义了对象的行为。Python中的类方法可以根据其用途和访问级别进行分类,包括实例方法、类方法、静态方法、特殊方法(或“魔术”方法)、以及以单个下划线开头的方法。下面是对这些方法的介绍。原创 2024-06-06 12:28:58 · 602 阅读 · 0 评论 -
【python】测试造数:批量创建接口api参数的数据
接到一个需要,要测试A接口,但是有一个参数"ProcessList"可以无限制输入,所以需要构造约两百条的数据,测试一下代码的健壮性。但是数据量太多了,手工造数太慢,因此采用脚本的形式造数,几分钟搞定。原创 2024-06-06 10:13:23 · 278 阅读 · 0 评论 -
【python】函数和方法的区别
在Python中,方法和函数在本质上是相似的,因为它们都是可调用的对象,但它们在定义和使用上存在一些细微的差别。以下是Python中方法和函数的主要区别。方法定义在模块级别,即它们不属于任何类。它们可以在任何地方被调用,只要它们在当前的作用域内或已经被导入。方法定义在类内部,它们属于类。方法通常与类的实例(对象)关联,但也可以作为类方法或静态方法存在。原创 2024-06-05 22:37:07 · 2253 阅读 · 0 评论 -
【python】嵌套函数
在Python中,可以在一个函数内部定义另一个函数,这被称为嵌套函数(nested function)。嵌套函数可以访问其外部函数(也称为封闭函数或外部作用域)的变量,但外部函数不能直接访问嵌套函数的变量,除非这些变量被明确地返回或作为外部函数的输出。原创 2024-06-05 12:51:36 · 836 阅读 · 0 评论 -
【python】匿名函数
是函数的参数列表,与正常函数定义类似,但不需要括号。是一个表达式,它会被计算并返回结果。这个表达式不能包含复杂的语句,如for循环或if语句(虽然可以使用三元运算符)。原创 2024-06-05 12:40:45 · 1981 阅读 · 0 评论 -
【python】垃圾回收机制:内存泄漏调优(三)
Python程序在运行时,会根据需要在内存中动态地分配内存空间来存储程序中的变量、对象、数据结构等。这些内存空间是临时的,并且随着程序的执行而动态地创建和销毁。一旦计算完成,如果需要将结果持久化,程序可能会将结果写入到硬盘等永久性存储器中,如文件、数据库等。然而,当处理的数据量非常大时,如果内存管理不当,或者程序没有有效地利用内存资源,就可能导致内存消耗过快,最终耗尽可用内存。这种情况通常被称为"Out of Memory"(OOM)错误,或者俗称"爆内存"。原创 2024-06-04 22:08:43 · 371 阅读 · 0 评论 -
【python】垃圾回收机制:示例(二)
Python程序在运行时,会根据需要在内存中动态地分配内存空间来存储程序中的变量、对象、数据结构等。这些内存空间是临时的,并且随着程序的执行而动态地创建和销毁。一旦计算完成,如果需要将结果持久化,程序可能会将结果写入到硬盘等永久性存储器中,如文件、数据库等。然而,当处理的数据量非常大时,如果内存管理不当,或者程序没有有效地利用内存资源,就可能导致内存消耗过快,最终耗尽可用内存。这种情况通常被称为"Out of Memory"(OOM)错误,或者俗称"爆内存"。原创 2024-06-04 21:57:14 · 276 阅读 · 0 评论 -
【python】驻留机制
定义:Python的驻留机制是Python解释器对值相同的变量进行内存处理的一种方式。具体来说,当多个变量引用同一个不可变对象(如某些整数和字符串)时,这些变量将共享同一个内存地址。目的:减少不必要的内存分配和回收,从而提高程序的运行效率。原创 2024-06-04 22:23:16 · 1047 阅读 · 0 评论 -
【python】导入模块or包(二)
上文虽然讲解了导包和导模块的基本操作,但是实际使用的时候,还是会很困惑,到底该怎么用。本文将结合具体的实例,展示Python导模块的基本操作。原创 2024-06-04 16:54:51 · 323 阅读 · 0 评论 -
【python】导入模块or包(一)
如果有一个自定义的Python文件(比如),并且该文件与的主脚本在同一个目录下,或者在Python的搜索路径中,可以直接导入它。import my_module # 使用my_module中定义的函数、类等__all__原创 2024-06-04 16:19:03 · 576 阅读 · 1 评论 -
【python】垃圾回收机制:原理(一)
Python的垃圾回收机制是自动进行的,它基于多种策略来确保不再使用的内存空间得到回收,从而防止内存泄漏。原创 2024-06-04 12:59:32 · 519 阅读 · 1 评论 -
【python】for _ in range(time_steps)
在Python编程中,`for _ in range(time_steps):` 是一个常见的循环结构,它用于重复执行某个代码块`time_steps`次。这里,`_` 是一个常用的约定俗成的变量名,用于表示我们不关心循环变量的具体值,而只关心循环的次数。原创 2024-06-04 09:45:15 · 203 阅读 · 0 评论 -
【python】示例:模拟冶金炉中的温度分布变化
这段代码主要模拟了一个一维热传导过程在冶金炉中的温度分布变化。具体地,它使用了有限差分法(Finite Difference Method, FDM)来求解一维热传导方程。代码包含参数设置、初始温度分布设置、有限差分法求解、冶金过程模拟、产量估算、性能评估以及温度分布图的绘制等功能。1、初始温度分布代码初始化了一个长度为Nx的数组T,表示温度分布。数组的所有元素都被设置为T_initial,除了第一个元素(左边界)和最后一个元素(右边界),它们分别被设置为T_boundary中的对应值。原创 2024-06-04 09:38:42 · 340 阅读 · 0 评论