Python
文章平均质量分 74
Python捞数人
这个作者很懒,什么都没留下…
展开
-
『Python』Pandas数据透视表(pivot_table)的存储与读取
当对某个DataFrame进行操作时,输出的透视表的列名会根据参数columns所指定的列内含有的类别进行细分,最终生成到Excel时,列名也会占据多行,虽然提高了肉眼的可读性,但再次用程序加载得到的表并不方便处理。原创 2024-05-31 10:01:33 · 443 阅读 · 0 评论 -
『Python』数据复用 - 缓存属性
通过cached_property实现数据复用原创 2024-05-25 11:56:25 · 796 阅读 · 0 评论 -
『Python』如何筛选异常回溯信息(Exception traceback)
利用traceback筛选特定的异常回溯信息原创 2023-08-19 22:17:32 · 232 阅读 · 0 评论 -
『Python』Windows系统清除Excel僵尸进程
清除遗留在后台的Excel原创 2023-07-14 12:04:16 · 359 阅读 · 1 评论 -
『Python』『Xlwings』逆天的大文件读写速度
使用Xlwings读写大文件原创 2023-01-10 16:40:10 · 1529 阅读 · 0 评论 -
『Python - Pandas』drop_duplicates方法失效的探索及一种解决方法
drop_duplicates 方法失效的原因以及相应解决方案原创 2022-12-03 16:57:43 · 1984 阅读 · 2 评论 -
『Python - Xlwings』如何方便快捷地在Excel中输入附带单元格格式的DataFrame
简单快捷地输入附带单元格格式的DataFrame原创 2022-10-25 20:08:52 · 622 阅读 · 0 评论 -
『Python - Xlwings』Excel报表自动化中常用函数/方法
Excel自动化常用方法原创 2022-10-22 16:27:47 · 1313 阅读 · 2 评论 -
『Python』Excel文件的读取以及DataFrame的相关操作 (4)—— 常用查询语句
~~原创 2022-08-14 15:32:13 · 675 阅读 · 0 评论 -
『Python』『Pandas/Xlwings』如何不覆盖已有工作表,把新数据写入新的Excel工作表
~~~原创 2022-07-18 23:12:08 · 3653 阅读 · 1 评论 -
『Python』Excel文件的读取以及DataFrame的相关操作 (3)
针对Sheet和DataFrame的一些方法原创 2022-06-19 16:31:21 · 2522 阅读 · 0 评论 -
『Python』获取列表中重复出现的某个元素的所有索引(index)
利用pandas的index方法获取列表索引原创 2022-06-02 09:47:39 · 1706 阅读 · 0 评论 -
『Python』 #NUM 导致 pandas 无法读取 Excel 文件(已解决)
在我负责的 ETLETLETL 项目中,遇到了一种比较奇葩的情况。查了下导致 #NUM! 的出现的原因:数值过于巨大计算公式导致根据 PythonPythonPython 给出的错误提示,我猜测我遇到的问题应该属于第一类情况OverflowError: cannot convert float infinity to integer报错代码:import pandas as pdfile_path = r'C:show.xls'pd.read_excel(file_path)这.原创 2022-05-19 14:33:09 · 2522 阅读 · 0 评论 -
『Python』pytest 单元测试迅速上手 (for Pycharm)
背景介绍进行项目交付之前,甲方通常需要开发者保证项目代码的测试覆盖率达到某个值,为此我们需要为项目中的代码编写相应的单元测试,然后把代码提交到 CICICI 工具,运行 pipeilnepipeilnepipeilne 并得到单元测试(后面简称 UTUTUT)代码对项目代码的覆盖率在项目开发的过程中,若可以确定某部分代码在未来不怎么会改动,就可以为这部分代码写 UTUTUT 代码了 写UT前的准备工作写UT前的准备工作写UT前的准备工作一、文件夹创建为 UTUTUT 单独创建一个文件夹 t.原创 2022-05-07 10:45:26 · 895 阅读 · 0 评论 -
『Python』tkinter 弹窗解压加密的 winzip文件
目标:解压 zipzipzip 文件夹下的所有 winzipwinzipwinzip 文件,当需要解压密码时,利用 tkintertkintertkinter 弹框接收密码,最终把所有解压出来的文件放到 unzipunzipunzip 文件夹下pyzipperpyzipperpyzipper : 0.3.5tkintertkintertkinter : pythonpythonpython 内置包文件分布情况:把上面的六个普通文件每两个压缩为一个 winzipwinzipwinzip 文.原创 2021-12-11 17:42:10 · 769 阅读 · 0 评论 -
『Python』Excel文件的读取以及DataFrame的相关操作 (2)
最近经常使用 pythonpythonpython 对 ExcelExcelExcel 文件进行 ETLETLETL 操作,其中 pandaspandaspandas 中一些函数经常用到,因此写下来作为初步总结。本章内容偏向于数据的定位与提取1. 已知某值,定位它在列表 list1list1list1 中的位置,即返回它的索引index_num = list1.index('specified_value')2. 将某列值设为 DataFrameDataFrameDataFrame 的索引df.原创 2021-11-28 21:03:20 · 4996 阅读 · 0 评论 -
『R语言&Python』针对多分类离散型变量的特征工程
在训练模型之前,我们常常需要根据不同变量的基本情况进行相应且合理的特征工程,通过阅读文献和自行尝试,我针对多分类变量的特征工程做出了一些总结数据来源(adult数据集):https://archive.ics.uci.edu/ml/datasets/Adult数据来源(adult数据集):https://archive.ics.uci.edu/ml/datasets/Adult数据来源(adult数据集):https://archive.ics.uci.edu/ml/datasets/Adult P.原创 2021-10-02 12:22:28 · 879 阅读 · 0 评论 -
『R语言&Python』建模前的准备:连续型与离散型变量探索,离散型变量转为虚拟变量
在建立模型之前,我们常要先对数据的类型作出判断,连续型数据可以不做处理,而离散型数据则可能需要转为虚拟变量。下文使用R语言中的经典数据集 mtcarsmtcarsmtcars 进行演示Python:Python:Python:数据集内的数据如下(复制粘贴即可):# pythonmpg = [21.0, 21.0, 22.8, 21.4, 18.7, 18.1, 14.3, 24.4, 22.8, 19.2, 17.8, 16.4, 17.3, 15.2, 10.4, 10.4, 14.7, 32.4原创 2021-09-12 21:09:50 · 2225 阅读 · 0 评论 -
『R语言&Python』使用logging、log4r写日志
在开发的过程中,日志能很好的帮助我们记录脚本运行过程中产生的信息,还能帮助我们定位异常,下面总结下R和python中用于写日志的函数原创 2021-09-04 19:04:14 · 1284 阅读 · 4 评论 -
『R语言&Python』 Excel文件的读取以及DataFrame的相关操作 (1)
Python部分:一、读取Excel提到读取数据,就不得不说 pandas 这个库了,它可以读取的文件格式如图;对表格进行数据分析时,常使用 read_csv 或者 read_excel首先把 C:\Users\acer\Desktop\data analysis\Playing.xlsx 文件地址赋值给 filepath,然后使用 pd.read_excel( ) 方法读取该文件,注意参数 sheet_name=1 意味着读取第二个表格import pandas as pdfilepath原创 2021-04-29 22:46:15 · 3657 阅读 · 0 评论 -
『R语言&Python』基础文件操作
目标:利用R/Python实现创建、删除、检测文件知识预备:绝对路径、相对路径和动态路径-绝对路径:直接从盘符开始的描述文件(夹)所在的完整路径。△:可能泄露个人信息# 例如通过下面这个路径别人就能知道我有彩虹六号这个游戏,并且存放路径一目了然path = 'C:\Users\acer\Documents\My Games\Rainbow Six - Siege'-相对路径:通肠胃使用"."或者".."开头,从当前目录或者父目录开始的路径。 △:相对安全> getwd() #获取当原创 2021-06-07 22:11:58 · 296 阅读 · 2 评论