- 博客(55)
- 资源 (2)
- 收藏
- 关注
原创 【xlwings】结合pandas做类似vlookup的功能
结合xlwings和pandas,使之实现类似vlookup的功能,并演化为变量方式进行
2024-02-18 10:46:02 559
原创 【打包】pyinstaller打包matplotlib后闪退的实操可行的解决方法
matplotlib打包容易出现闪退而不知原因,所以经历神农尝百草后,分享已经打包成功的经验
2024-01-08 15:39:34 594
原创 【Python】 字符串格式
如上所示,如果用 {} 包围索引并将其嵌入到字符串中,则该字符串将与 format 方法的参数索引一起输出。与之前一样,{0:.1f} 中的 0 指定参数的索引。对于数值,可以指定要显示的小数位数,如下所示。该表示法是通过在要定义的字符串的开头添加 f 或 F 来定义的。到目前为止,可能已经在代码中多次看到字符串连接,但再次看一下。输出字符串的场景有很多,所以来了解一下生成字符串的各种方式。如上所示,可以使用或不使用 + 运算符来连接字符串。因此,如果更改如下指定的索引,将得到相应的输出结果。
2023-12-28 13:26:56 708
原创 可以加速 Pandas(即使在 CPU 环境中)而无需编码...... FireDucks
根据官网介绍,并不是所有的pandas方法都更快,但是兼容的方法数量会逐渐增加(FireDucks不支持的方法会在内部转换为常规的pandas方法)。(既然被调用了,就不’这并不意味着它不能使用,它只是似乎没有加速。另一方面,对于“显式导入”,请在导入语句中显式指定fireducks。会尝试测量groupby()方法的效果,但由于数据量很小,将循环它10,000次并测量它。显然,一个库已经发布,可以在不改变现有代码的情况下加速 Pandas。如果它是免费且易于使用且无需更改代码的,我认为没有理由不使用它。
2023-12-28 13:05:32 435
原创 【Python】split()和字符串分割
Python 的 split() 方法在指定分隔符处分割字符串,并将分割后的子字符串作为列表返回。 将通过代码示例解释如何使用 split() 方法。
2023-12-15 10:07:43 252
原创 【Python】从文本中提取数字
在正整数、负整数、小数和欧洲小数这四种情况下,提取文本中包含的数字的正则表达式如是:pattern = r'[^+\-\d]*([+-]?\d+([.,]\d+)?).*'
2023-12-15 09:50:26 470
原创 【Python】计算一年内的总天数(还有跨年日期)
花了一段时间才找到Python中求一年中总日数(total day of the Year)的格式代码,所以也把计算方法记录下来。
2023-12-14 14:58:23 713
原创 【Pandas】 sql查询
在进行数据分析时,Pandas 是一个非常流行的 Python 数据分析库。 然而,如果习惯用 SQL 从数据库检索和操作数据,Pandas 的语法有点望而生畏。 这时 pandasql 可派上用场。 该库可直接在 Pandas DataFrame 上运行 SQL 查询。
2023-12-13 10:19:48 540
原创 【Pandas】时间序列数据按年聚合
一开始计算财政年度可能很痛苦。一旦意识到这一点,正好就是编程的创意来源,因此calc_fiscal_year() 是关键。
2023-12-13 10:03:44 87
原创 比较 pandas 和 Polars 的处理速度和易用性
Polars在速度方面比pandas有优势,可以看作是能够解决pandas的弱点。这次,想测量一下 pandas 和 Polars 之间的处理速度,并验证哪一个更好,包括易用性。最后总结以下三点: 执行速度 library的便利 可以用polar取代pandas吗?
2023-12-12 14:41:44 382
原创 【Python】函数的定义和函数的处理
定义函数允许您定义一次并重复使用它,只要您想重复使用同一过程即可。Def用于定义一个函数。函数名旁边写的 (thing, basket) 是参数。至于参数,我们将在以后的文章中详细讨论,但它们将是传递给函数的变量。通过改变这个参数的值,即便使用相同的逻辑,结果也会改变。
2023-12-12 10:06:50 153
原创 【Python】int(a/b) 和 a//b 之间的巨大区别
从今以后,请尽可能避免 int(a/b) ,并使用 a//b 代替。这个纯粹的问题点出 int(a/b) 和 a//b 之间的区别。因为大于 53 位的数字只是近似值,所以无法产生正确的结果。因为诧异于 WA 和 AC 的变化,所以研究了其中的差异。通过“a/b 返回 float,a//b 返回 int”,事实证明,对于float来说,数字只能到第53位。使人诧异的是整数(int)的精度没有上限……int(a/b) 和 a//b 之间的区别。而事实上,这次处理的数字超过了53位。区别在于是否发生溢出。
2023-12-11 17:52:29 270
原创 活用异常处理(try-except)
简要介绍Python的异常处理(try-except)。 - except 异常名称:捕获特定异常 - except 异常名称作为变量名称:将异常对象存储在变量中 - except可以设置多个例外。 - 如果 except 中没有指定异常名称,则捕获所有异常。
2023-12-11 17:31:05 250
原创 【Python】 推导式总结
还可以通过 if 语句对列表中的变量套用条件,从而缩小列表范围。为了更高效地编写列表类型变量,有一种称为推导式的编写方式,这是表达列表的主流方式。list1.append()内容的值存储在 list1.append() 方法中。Python有列表类型的变量,可以存储很多变量的值。(稍后,我们将通过比较来理解耗时。[]中i对应的变量可以是任意变量。实际上将 1 到 100 之间的数字存储在列表类型变量中。另外,Python 是一种解释性语言,因此速度相当慢。
2023-12-08 17:31:17 69
原创 Python 的list是...
顺便说一下,np.std(my_list) 和 st.stdev(my_list) 是不同的,原因是通常的 ARE。但是,如果你让它的行为像 numpy.ndarray (除了会出现的混乱),那么“列表”的存在岂不是毫无意义?我们是否应该将当前的 +、* 更改为 +++、***(因为 ** 是幂),就像最近引入的“海象运算符”一样?好吧,如果可以直接说它是一个对列表类型执行指定操作的运算符就好了,但是在一致性方面就有点令人失望了。能够执行 sum()、min() 和 max() 的情况非常罕见。
2023-12-08 17:20:05 71
原创 【问题】如果使用 openpyxl 的 iter_rows() 中断工作表行迭代,将无法删除该文件
用openpyxl打开Excel文件后,尝试删除,但进程阻塞了该文件,因此无法删除。虽然没根本的解决方案,但也尝试在不破坏迭代的情况下更改
2023-12-08 16:32:25 116
原创 【Python】按升序排列 Excel 工作表
发现按名称对 Excel 工作表进行排序很麻烦,因此创建了一个代码来使用 Python 的 openpyxl 对它们进行排序。
2023-12-08 15:48:33 1119
原创 使用openpyxl获取Excel最后一行时要注意的事项
openpyxl的worksheet.max_row获取最大行数。 但后来发现这里有个bug。实际上,如果设置了格式,即使单元格中没有值,此 max_row (获取最后一行)也会将该单元格识别为最后一行。新文件可以置此不理,但旧文件或者多人共享文件则不可等闲视之。因此需要设置递减单元格判别是否有值。
2023-12-08 15:37:26 922
原创 【Python】 for 循环与 lambda 表达式函数结合使用的技巧
Python内建函数lambda中,For循环(loop)的每次迭代都会重新分配变量名称,因此有必要使用默认关键字参数来解决
2023-12-08 14:34:58 770
原创 【python】is和==
python中有两个比较运算子来判断两个是否相同。一个是==,一个是is。== 传回为每个类别设定的eq方法的结果。基本上就是用来表示值是否相等,设定了这样的方法。另一方面,is 取得物件的 id 并判断是否匹配。即判断对像是否相同。此行为无法变更。python 中的每个物件都有一个“标识符”,即 id。您可以使用内建函数 id() 进行检查。
2023-12-08 14:32:18 43
原创 如何在 Python Pandas 中将特定列转换为虚拟变量
此代码首先为 Type 列创建一个虚拟变量并将其存储在 type_dummies 中。接下来,我们从原始数据框中删除 Type 列,并将 type_dummies 连接到原始数据框中。通过使用这种方法,您可以将特定的定性变量转化为虚拟变量并使用它们进行分析。想在Python中将数据框integrated_data的定性变量设为虚拟变量,但是当我运行下面的代码时,发生了错误。如果只想将数据框integrated_data的特定列类型转换为虚拟变量,请修改代码如下所示。现在可以将定量转换为虚拟变量。
2023-12-02 14:19:06 109
原创 Pandas的df.rename()和df.where()解释
Pandas 是一个 Python 数据分析库,有许多有用的函数,可以轻松使用。在本文中,将解释两个函数:df.rename() 和 df.where()。
2023-12-02 14:12:33 1467
原创 使用Python快速读写大量CSV数据
使用 chunk 一次读取输入文件 1000 行,并将写入留给 Pandas 的 to_csv 方法,这起作用了。使用 chunk 进行部分处理有防止内存过度使用和加速 IO 的优点,所以请尝试一下。首先,听说一次写入多行比一次写入一行更快,所以准备了一个缓冲区。上述步骤2中的IO(读/写)过程需要几个小时,因此需要改进。顺便说一句,如果数据被分成多个文件,因为并行处理是有利的。当前进程逐行读取输入文件并将要提取的每一行写入输出文件。加快读取和写入大量数据的过程,而不影响输出文件的内容。
2023-12-02 14:02:04 393
原创 使用 Pandas read_csv() 读取压缩文件
本文介绍了可使用 Pandas 的 read_csv() 读取的压缩文件。read_csv() 这个名称可能会让您认为它只能读取扩展名为“.csv”的文件,但它也可以读取包含 csv 的压缩文件。这次描述了可以使用 read_csv() 读取的压缩文件。使用这种方法是因为在工作中使用的数据最近开始以 BZ 格式而不是 csv 格式分发。当用于分析的文件被压缩发送时,或者当使用 CSV 格式会占用空间时,它似乎很有用。Pandas read_csv()小数点的原因及对策。
2023-12-02 13:28:41 470
原创 【Python】f 字符串
自从python 3.6之后拥有的新功能,f 字符串(f-string)十分好用!无论是规定格式还是写公式,都比format()好用得多。
2023-12-01 13:03:59 185
原创 【Python】获取Access数据库的表和字段
由于以前用了不少access数据库,导致每每打开方知数据在哪里。因为从其他网站得到启发,完成了整个查找并罗列access数据库中表和字段的程序开发,这里也分享一下思路,希望可以帮助到各位
2023-12-01 11:15:59 465
原创 【Python】超方便的用字典的方法! 不再需要错误处理!
get(key) 方法就很方便。它不仅返回key对应的值,如果不存在也返回None。不报错。
2023-11-28 10:53:51 162
原创 Pandas read_csv()小数点的原因及对策
在本文中,将介绍Pandas的read_csv()读取数值数据时添加“.0”等小数点的原因以及对策。这次介绍了使用read_csv()读取数值数据时添加小数点的原因以及对策。如果ID等中包含“.0”,那么含义可能会改变,或者更新数据库时可能会发生错误,所以想记下这个规则。
2023-11-28 10:24:54 815
Python获取Access数据库的表和字段
2023-12-01
【pandas+openpyxl+tkinter】单页excel聚合文本
2023-07-11
【python+tkinter】生成二维码的pgn
2023-06-27
【pandas+tkinter】根据excel表生成图表
2023-04-21
Python合并多个csv成一个excel(pandas+Tkinter)
2023-04-13
拆分每一页PDF——扫描版或非扫描版
2022-08-15
【Python】os + pandas:同一文件夹下,生成该文件夹的超链接(excel)
2022-06-06
【Python】os + pandas:转换CSV到excel并自动删除CSV
2022-06-06
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人