自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(55)
  • 资源 (2)
  • 收藏
  • 关注

原创 如何取消和设置MultiIndex(pandas)

在pandas中,如何对行或列添加或取消多重索引

2024-02-20 17:14:00 706

原创 <xlwings> 读取xls文件并删除sheet

大量xls文件,只删去特定sheet的方法

2024-02-20 17:12:24 522

原创 【xlwings】结合pandas做类似vlookup的功能

结合xlwings和pandas,使之实现类似vlookup的功能,并演化为变量方式进行

2024-02-18 10:46:02 503

原创 【打包】pyinstaller打包matplotlib后闪退的实操可行的解决方法

matplotlib打包容易出现闪退而不知原因,所以经历神农尝百草后,分享已经打包成功的经验

2024-01-08 15:39:34 529

原创 【Python】 字符串格式

如上所示,如果用 {} 包围索引并将其嵌入到字符串中,则该字符串将与 format 方法的参数索引一起输出。与之前一样,{0:.1f} 中的 0 指定参数的索引。对于数值,可以指定要显示的小数位数,如下所示。该表示法是通过在要定义的字符串的开头添加 f 或 F 来定义的。到目前为止,可能已经在代码中多次看到字符串连接,但再次看一下。输出字符串的场景有很多,所以来了解一下生成字符串的各种方式。如上所示,可以使用或不使用 + 运算符来连接字符串。因此,如果更改如下指定的索引,将得到相应的输出结果。

2023-12-28 13:26:56 701

原创 可以加速 Pandas(即使在 CPU 环境中)而无需编码...... FireDucks

根据官网介绍,并不是所有的pandas方法都更快,但是兼容的方法数量会逐渐增加(FireDucks不支持的方法会在内部转换为常规的pandas方法)。(既然被调用了,就不’这并不意味着它不能使用,它只是似乎没有加速。另一方面,对于“显式导入”,请在导入语句中显式指定fireducks。会尝试测量groupby()方法的效果,但由于数据量很小,将循环它10,000次并测量它。显然,一个库已经发布,可以在不改变现有代码的情况下加速 Pandas。如果它是免费且易于使用且无需更改代码的,我认为没有理由不使用它。

2023-12-28 13:05:32 420

原创 【Python】split()和字符串分割

Python 的 split() 方法在指定分隔符处分割字符串,并将分割后的子字符串作为列表返回。 将通过代码示例解释如何使用 split() 方法。

2023-12-15 10:07:43 162

原创 【Python】从文本中提取数字

在正整数、负整数、小数和欧洲小数这四种情况下,提取文本中包含的数字的正则表达式如是:pattern = r'[^+\-\d]*([+-]?\d+([.,]\d+)?).*'

2023-12-15 09:50:26 400

原创 【Python】计算一年内的总天数(还有跨年日期)

花了一段时间才找到Python中求一年中总日数(total day of the Year)的格式代码,所以也把计算方法记录下来。

2023-12-14 14:58:23 635

原创 【Python】多维列表排序

多维列表排序:单键排序和多键排序,以及很小文章提及的,多键排序中,一个键升序,另一键降序

2023-12-14 13:51:21 299

原创 【python】比起os.path,Pathlib太方便了

pathlib比os.path更方便,不妨一试!

2023-12-14 11:30:44 201

原创 【Pandas】 sql查询

在进行数据分析时,Pandas 是一个非常流行的 Python 数据分析库。 然而,如果习惯用 SQL 从数据库检索和操作数据,Pandas 的语法有点望而生畏。 这时 pandasql 可派上用场。 该库可直接在 Pandas DataFrame 上运行 SQL 查询。

2023-12-13 10:19:48 507

原创 【Pandas】时间序列数据按年聚合

一开始计算财政年度可能很痛苦。一旦意识到这一点,正好就是编程的创意来源,因此calc_fiscal_year() 是关键。

2023-12-13 10:03:44 61

原创 比较 pandas 和 Polars 的处理速度和易用性

Polars在速度方面比pandas有优势,可以看作是能够解决pandas的弱点。这次,想测量一下 pandas 和 Polars 之间的处理速度,并验证哪一个更好,包括易用性。最后总结以下三点: 执行速度 library的便利 可以用polar取代pandas吗?

2023-12-12 14:41:44 337

原创 【Python】流程控制(重复处理)

将看看 while 和 for-in 等循环处理。 做简单的重复,但还要检查一下如何指定循环。

2023-12-12 10:39:40 221

原创 【Python】函数的定义和函数的处理

定义函数允许您定义一次并重复使用它,只要您想重复使用同一过程即可。Def用于定义一个函数。函数名旁边写的 (thing, basket) 是参数。至于参数,我们将在以后的文章中详细讨论,但它们将是传递给函数的变量。通过改变这个参数的值,即便使用相同的逻辑,结果也会改变。

2023-12-12 10:06:50 143

原创 【Python】int(a/b) 和 a//b 之间的巨大区别

从今以后,请尽可能避免 int(a/b) ,并使用 a//b 代替。这个纯粹的问题点出 int(a/b) 和 a//b 之间的区别。因为大于 53 位的数字只是近似值,所以无法产生正确的结果。因为诧异于 WA 和 AC 的变化,所以研究了其中的差异。通过“a/b 返回 float,a//b 返回 int”,事实证明,对于float来说,数字只能到第53位。使人诧异的是整数(int)的精度没有上限……int(a/b) 和 a//b 之间的区别。而事实上,这次处理的数字超过了53位。区别在于是否发生溢出。

2023-12-11 17:52:29 234

原创 活用异常处理(try-except)

简要介绍Python的异常处理(try-except)。 - except 异常名称:捕获特定异常 - except 异常名称作为变量名称:将异常对象存储在变量中 - except可以设置多个例外。 - 如果 except 中没有指定异常名称,则捕获所有异常。

2023-12-11 17:31:05 242

原创 Pip install的日志

可以看到模块是从哪里获取的

2023-12-08 18:36:25 249

原创 【Python】 生成二维码

用tkinter做前端,通过qrcode模块,做出了一个根据网页生成二维码的小程序

2023-12-08 18:20:36 6681 1

原创 【Python】列表乘积的计算时间

使用以下三种模式测量了计算列表乘积所需的时间:for 语句传递list/math模块/numpy

2023-12-08 17:41:21 73

原创 【Python】 推导式总结

还可以通过 if 语句对列表中的变量套用条件,从而缩小列表范围。为了更高效地编写列表类型变量,有一种称为推导式的编写方式,这是表达列表的主流方式。list1.append()内容的值存储在 list1.append() 方法中。Python有列表类型的变量,可以存储很多变量的值。(稍后,我们将通过比较来理解耗时。[]中i对应的变量可以是任意变量。实际上将 1 到 100 之间的数字存储在列表类型变量中。另外,Python 是一种解释性语言,因此速度相当慢。

2023-12-08 17:31:17 59

原创 Python 的list是...

顺便说一下,np.std(my_list) 和 st.stdev(my_list) 是不同的,原因是通常的 ARE。但是,如果你让它的行为像 numpy.ndarray (除了会出现的混乱),那么“列表”的存在岂不是毫无意义?我们是否应该将当前的 +、* 更改为 +++、***(因为 ** 是幂),就像最近引入的“海象运算符”一样?好吧,如果可以直接说它是一个对列表类型执行指定操作的运算符就好了,但是在一致性方面就有点令人失望了。能够执行 sum()、min() 和 max() 的情况非常罕见。

2023-12-08 17:20:05 63

原创 【问题】如果使用 openpyxl 的 iter_rows() 中断工作表行迭代,将无法删除该文件

用openpyxl打开Excel文件后,尝试删除,但进程阻塞了该文件,因此无法删除。虽然没根本的解决方案,但也尝试在不破坏迭代的情况下更改

2023-12-08 16:32:25 101

原创 使用openpyxl调整Excel的宽度

逐行加载Excel,并将行宽调整为行中的最大字符数。希望在打开 Excel 时能够看到所有字符。

2023-12-08 16:22:14 501

原创 如何使用openpyxl获取单元格值(计算结果,而不是公式)

openpyxl如何获得计算结果而不是公式

2023-12-08 16:09:58 1347

原创 【Python】按升序排列 Excel 工作表

发现按名称对 Excel 工作表进行排序很麻烦,因此创建了一个代码来使用 Python 的 openpyxl 对它们进行排序。

2023-12-08 15:48:33 1075

原创 使用openpyxl获取Excel最后一行时要注意的事项

openpyxl的worksheet.max_row获取最大行数。 但后来发现这里有个bug。实际上,如果设置了格式,即使单元格中没有值,此 max_row (获取最后一行)也会将该单元格识别为最后一行。新文件可以置此不理,但旧文件或者多人共享文件则不可等闲视之。因此需要设置递减单元格判别是否有值。

2023-12-08 15:37:26 753

原创 【Python】 for 循环与 lambda 表达式函数结合使用的技巧

Python内建函数lambda中,For循环(loop)的每次迭代都会重新分配变量名称,因此有必要使用默认关键字参数来解决

2023-12-08 14:34:58 664

原创 【python】is和==

python中有两个比较运算子来判断两个是否相同。一个是==,一个是is。== 传回为每个类别设定的eq方法的结果。基本上就是用来表示值是否相等,设定了这样的方法。另一方面,is 取得物件的 id 并判断是否匹配。即判断对像是否相同。此行为无法变更。python 中的每个物件都有一个“标识符”,即 id。您可以使用内建函数 id() 进行检查。

2023-12-08 14:32:18 31

原创 如何在 Python Pandas 中将特定列转换为虚拟变量

此代码首先为 Type 列创建一个虚拟变量并将其存储在 type_dummies 中。接下来,我们从原始数据框中删除 Type 列,并将 type_dummies 连接到原始数据框中。通过使用这种方法,您可以将特定的定性变量转化为虚拟变量并使用它们进行分析。想在Python中将数据框integrated_data的定性变量设为虚拟变量,但是当我运行下面的代码时,发生了错误。如果只想将数据框integrated_data的特定列类型转换为虚拟变量,请修改代码如下所示。现在可以将定量转换为虚拟变量。

2023-12-02 14:19:06 89

原创 Pandas的df.rename()和df.where()解释

Pandas 是一个 Python 数据分析库,有许多有用的函数,可以轻松使用。在本文中,将解释两个函数:df.rename() 和 df.where()。

2023-12-02 14:12:33 1174

原创 使用Python快速读写大量CSV数据

使用 chunk 一次读取输入文件 1000 行,并将写入留给 Pandas 的 to_csv 方法,这起作用了。使用 chunk 进行部分处理有防止内存过度使用和加速 IO 的优点,所以请尝试一下。首先,听说一次写入多行比一次写入一行更快,所以准备了一个缓冲区。上述步骤2中的IO(读/写)过程需要几个小时,因此需要改进。顺便说一句,如果数据被分成多个文件,因为并行处理是有利的。当前进程逐行读取输入文件并将要提取的每一行写入输出文件。加快读取和写入大量数据的过程,而不影响输出文件的内容。

2023-12-02 14:02:04 352

原创 使用 Pandas read_csv() 读取压缩文件

本文介绍了可使用 Pandas 的 read_csv() 读取的压缩文件。read_csv() 这个名称可能会让您认为它只能读取扩展名为“.csv”的文件,但它也可以读取包含 csv 的压缩文件。这次描述了可以使用 read_csv() 读取的压缩文件。使用这种方法是因为在工作中使用的数据最近开始以 BZ 格式而不是 csv 格式分发。当用于分析的文件被压缩发送时,或者当使用 CSV 格式会占用空间时,它似乎很有用。Pandas read_csv()小数点的原因及对策。

2023-12-02 13:28:41 363

原创 【Python】f 字符串

自从python 3.6之后拥有的新功能,f 字符串(f-string)十分好用!无论是规定格式还是写公式,都比format()好用得多。

2023-12-01 13:03:59 175

原创 【Python】获取Access数据库的表和字段

由于以前用了不少access数据库,导致每每打开方知数据在哪里。因为从其他网站得到启发,完成了整个查找并罗列access数据库中表和字段的程序开发,这里也分享一下思路,希望可以帮助到各位

2023-12-01 11:15:59 361

原创 【Python】超方便的用字典的方法! 不再需要错误处理!

get(key) 方法就很方便。它不仅返回key对应的值,如果不存在也返回None。不报错。

2023-11-28 10:53:51 146

原创 Pandas read_csv()小数点的原因及对策

在本文中,将介绍Pandas的read_csv()读取数值数据时添加“.0”等小数点的原因以及对策。这次介绍了使用read_csv()读取数值数据时添加小数点的原因以及对策。如果ID等中包含“.0”,那么含义可能会改变,或者更新数据库时可能会发生错误,所以想记下这个规则。

2023-11-28 10:24:54 688

原创 【os】用于提高业务效率的各种os模块

正如标题所示,介绍一下(个人)常用的OS模块的命令。

2023-11-21 10:33:13 146

原创 python中设置Excel数据验证规则的函数

使用python的openpyxl为Excel中的任何单元格设置数据输入规则。

2023-11-21 09:48:08 358

Python获取Access数据库的表和字段

该程序用于查看access数据库中有哪些表和字段,从而可以不用打开access数据库而得知里面有什么表以及字段。适合过去大量使用access数据库,并且已经设计成只需要选择access数据库本身,即可从中提取表和字段的场景

2023-12-01

【pandas+openpyxl+tkinter】单页excel聚合文本

虽然该功能事实上在excel的powerquery相当容易实现(https://mp.weixin.qq.com/s/-QsuNlpicJBU4mlsfCv2PQ),但是好奇心驱使下,所以制作出这一个在tkinter下的GUI,使用其中的combobox通过选择来完成的文本的聚合。 其中为combox赋值因为速度的因素用了openpyxl——因为据闻pandas会全扫描,但openpyxl不会。不过openpyxl却不能支持xls,暂时只能读xlsx的excel。而且目前只能针对单页excel来进行文本聚合。 此外,这里的tkinter也设置了经询问的后台关闭,防止不能关闭。 完成选择后,按『合成』之后,通过os的设置,会立即打开excel文件。 注:文本聚合指的是,比如分类为北上广这几地,将当中属于北上广的姓名分北上广归在一起,以『、』作为分隔。比如:广州:张三、李四这样

2023-07-11

【python+tkinter】生成二维码的pgn

【用法】该exe双击后,通过tkinter生成的界面,在entry录入url(超链接)和二维码的名字;该二维码以png图片形式储存,程序运行完成后会立即打开同一文件夹里面的二维码,方便存储或者分享。 【用料】该exe打包之前,python运用了os(获取路径),tkinter和qrcode编纂。

2023-06-27

【tkinter和pandas的联动】根据某列分sheet

通过tkinter作为前端(frontend)取得excel列里的名字,从而分按列里的名字分表到每个sheet中。

2023-05-31

【pandas+tkinter】根据excel表生成图表

【库】 该资源使用pandas和tkinter来制作 【功能】 通过自动判定最大列数和行数,并可以统计或不统计最后一行(汇总行)来获得条形图或者堆积条形图,从而达到通过拣选一个excel文件(.xslx)进而简单快捷地在excel上生成统计图表;并且图表包含柱状图(堆积)、条形图(堆积)、面积图(堆积)、折线图和雷达图,并通过tk界面用combobox来选择并通过按键(botton)执行生成操作;操作完成后,直接打开excel,方便查看和加工。

2023-04-21

Python合并多个csv成一个excel(pandas+Tkinter)

【用法】该exe双击后,通过tkinter选取所需的csv文件(可以单选或者多选,全凭鼠标选择)合并成一个和exe同一文件夹的excel文件(CSV合并后.xlsx),操作较简单。方便日常办公中,统合和整理数据,并用作进一步的加工分析。 【用料】该exe打包之前,python运用了os(获取路径),re(只要文件名,后缀也不要),pandas(concat,read_csv等),当然还有tkinter(askopenfilenames)编纂。

2023-04-13

同文件夹合并PDF(扫描件+非扫描件)

用python在虚拟环境下开发,在同文件夹下,双击后合并所有PDF(扫描件+非扫描件),并生成『合并文件.pdf』

2022-08-19

生成文件夹中的链接到Excel文件

用python制作并打包exe,只要将该exe放到文件夹中,双击后生成文件夹中文件的excel格式的链接。

2022-08-16

拆分每一页PDF——扫描版或非扫描版

将PDF放在和执行文件(.exe)同一个文件夹,该执行文件双击后,录入有待拆分的PDF的文件名(无须后缀),将会在该文件夹内,生成录入文件名为名字,从1到n的PDF 例如:录入ABC(文件名:ABC),而文件夹刚好有ABC.pdf, 那么生成ABC1.PDF、ABC2.PDF、ABC3.PDF...ABCn.PDF

2022-08-15

【Python】os + pandas:同一文件夹下,生成该文件夹的超链接(excel)

内容概要:同一文件夹下,生成该文件夹的超链接; 使用人群:员工; 工具:从Python3(pandas、os)到excel; 使用建议:所有操作请在桌面执行;将『生成超链接excel.py』双击生成『txt_超链接测试.xlsx』后,打开『Sheet1』点击任一名字即可打开放置在『测试文件夹』的文件。

2022-06-06

【Python】os + pandas:转换CSV到excel并自动删除CSV

将需要转换的CSV文件和该执行文件(.exe)放在同一文件夹,双击后生成和CSV同名的Excel文件,并自动删去CSV文件。

2022-06-06

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除