pandas
文章平均质量分 51
勤奋的大熊猫
自学四年的 Python 筑基期巅峰修士
光子学硕士
图像处理爱好者
机器学习萌新
展开
-
Pandas 对带有 Multi-column(多列名称) 的数据排序并写入 Excel 中
如果我们想要读取上述数据,并让它们按照 Number 列进行排序该怎么办呢?写入后的数据顺序是杂乱无章的。原创 2024-02-07 11:29:22 · 1035 阅读 · 0 评论 -
Pandas ------ 通过 np.array 函数或 tolist 方法去掉数据中的 index
数据处理的时候遇到了一个问题,获取到的数据总是会带有。为了去掉这些显示,我们可以使用。可以看到,通过这种方式获取到的数据左侧会有。正常情况下,我们可以使用如下代码获取。这些不必要的额外信息,我们可以使用。函数进行数据类型的转换。原创 2024-01-25 16:35:18 · 460 阅读 · 0 评论 -
Pandas ------ 如果读取带有 multi-index 和 Multi-column 表头的数据
导致列向表头与数据之间存在一行的间隔,那么如果我们要读取我们写入的数据,且希望它能够被正常显示该怎么办呢?可以看到,通过使用上述方法,我们成功获取到了我们想要的结果。我们可以使用如下代码获取。原创 2024-01-25 16:34:20 · 473 阅读 · 0 评论 -
Pandas ------ 向 Excel 文件中写入含有合并表头的数据
可以看到,此时,纵向表头的第一行已经被合并了,且它是由两列合并得到。对比代码,我们可以看出,如果想要得到带有合并表头的数据,我们只需要在设置多。数据时,对于需要合并表头的数据重复书写,重复书写的次数与其他行表头数据总数一致,比如这里,我们在代码中的二维列表。文件中写入含有合并表头的数据。中写入带有合并表头的数据。这里给大家介绍一下如何向。字符串重复书写了两次。至此,我们介绍了如何向。原创 2024-01-25 16:03:16 · 792 阅读 · 0 评论 -
Pandas ------ 向 Excel 文件中写入含有 multi-index 和 Multi-column 表头的数据
对比代码,我们看到,如果想要两层表头,我们只需要在写入的时候将。那么对于含有多表头的数据,我们该如何将它们写入。运行上述代码后,我们会在代码存放的目录下找到一个名为。如果只需要一层表头,使用一维字符串数组来指定即可。可以看到,此时文件具有多个表头,沿着纵向有两层。事实上,它并不影响输出文件的主要内容。参数使用二维字符串数组来指定即可。一文中我们介绍了如何通过。的名字,沿着横向有两层。至此,我们介绍了如何向。原创 2024-01-25 15:55:05 · 1137 阅读 · 0 评论 -
Pandas 获取数据的尺寸信息
Pandas中获取数据的尺寸信息,比如我们有如下的Excel数据:我们可以使用如下代码来获取数据的整体尺寸信息:import pandas as pdfile = pd.read_excel(r"C:\Users\15025\Desktop\uncle\debug.xlsx")print(file.size)print(file.shape)print(len(file))"""result:55(11, 5)11"""可以看到,结果与numpy包中的结果类似,当我们的数据为原创 2022-02-24 18:31:40 · 3066 阅读 · 0 评论 -
pandas.merge()函数用法详解
这里记录一下pandas.merge()函数的用法。使用DataFrame一和二中的共有参数将两个DataFrame融合起来。import pandas as pddf1 = pd.DataFrame({'key': ['K0', 'K1', 'K2', 'K3'], 'A': ['A0', 'A1', 'A2', 'A3'], 'B': ['B0', 'B1', 'B2', 'B3']})df2 = pd.D原创 2022-02-23 16:32:28 · 6987 阅读 · 0 评论 -
Pandas 提取单元格中的文字并进行切片处理
比如我们有如下的Excel数据:现在我们想要提取其中付款时间列中的内容,并且仅截取出发货的当天具体时间。我们可以使用.str.slice()来解决这一问题,代码如下:import pandas as pdfile = pd.read_excel(r"C:\Users\15025\Desktop\uncle\debug.xlsx")time = file["付款时间"].str.slice(11, 19)print(time)"""result:0 23:57:141 2原创 2022-02-23 10:18:31 · 2761 阅读 · 4 评论 -
pandas 向excel表格中一次性输入多个sheet页
前段时间遇到了一个问题,就是想要直接向excel文件中一次性输入多个sheet页面。然而每次输入多个的时候,前面输入的都被抹掉了。只保留了最后一次输入的内容,这里记录一下找到的方法:import pandas as pddf = pd.read_excel("D:/User(origin in C)/desktop/pandas.xlsx")# print(df)with pd.ExcelWriter("D:/User(origin in C)/desktop/pandas_test .xlsx原创 2021-10-14 15:34:12 · 1636 阅读 · 0 评论 -
pandas中提取单行单列数据时的参数问题
先来看一个问题,如果我们有一个二维数组如下所示,我们想要提取其中的某一行。这个问题在pandas基础操作(超链接点击跳转)中我们有提到过。data = {'Country': ['Belgium', 'india', 'Brazil'], 'Capital': ['Brussels', 'New Delhi', 'Brasilia'], 'Population': [ '11190846', '1303171035', '207847528']}df = pd.DataFrame(data, c原创 2021-10-01 11:15:25 · 419 阅读 · 0 评论 -
pandas基础操作
说到excel表格中的数据处理,就不得不提到pandas模块。这里简单分享一下pandas模块的基础操作。这里表格文件的数据类型以xlsx和csv来举例。举例1:创建一维带标签的数组df = pd.Series([3, -5, 7, 4], index=['a', 'b', 'c', 'd'])print(df)"""reuslt:a 3b -5c 7d 4dtype: int64"""可以看到一维的数据是以列的形式进行排列的举例2:创建二维带标签的数组d原创 2021-10-01 10:51:57 · 152 阅读 · 0 评论 -
pandas向已经拥有数据的Excel文件中添加新数据
不知道大家有没有过相同的经历,就是我们向Excel表格中添加新数据的时候,经常会导致原先拥有的数据被覆盖掉了,那么如何解决这个问题呢,这里给出一种可行的方法。阅读此篇的基础是先理解pandas DataFrame拼接。(超链接点击跳转)比如我们有一个Excel数据,其中有数据如下图所示:然后我们想向其中加入一组新的数据,比如:leben (v) 生活。那么该如何实现呢?请看如下代码:# -*- coding:utf-8 -*-import pandas as pddf = pd.read_ex原创 2021-05-04 22:48:44 · 7857 阅读 · 2 评论 -
pandas DataFrame拼接
在pandas模块中,通常我们都需要对类型为DataFrame的数据进行操作,其中最为常见的操作便是拼接了。比如我们将两个Excel表格中的数据读入,随后拼接完成后保存进一个新的Excel表格文件中。之前查找了相关的博客, 发现网络上鱼龙混杂。有些代码完全无法执行,为了提高效率,这里做一个详细地记录。DataFrame数据拼接方法一:使用.append()方法。# -*- coding:utf-8 -*-import pandas as pddf1 = pd.DataFrame([[1, 2],原创 2021-05-04 22:30:06 · 14561 阅读 · 9 评论