【Pandas】DataFrame数据的增删改

DataFrame查询操作参见:https://blog.csdn.net/weixin_45760274/article/details/123448770

DataFrame增加数据

构建数据:

import pandas as pd
import numpy as np

# 创建DataFrame
df = pd.DataFrame(
    data=[
        ['zs', 18, 1],
        ['ls', 19, 1],
        ['ww', 17, 2]
    ],
    index=['stu0', 'stu1', 'stu2'],
    columns=['name', 'age', 'group']
)
print('df:\n', df)

在这里插入图片描述

增加一行

# 行的方向上增加----> 增加一行----> 给数据集添加一个新的数据对象
df.loc['stu3', :] = ['zl', 20, 2]
# 将 age 和 group 的类型修改为 int64
df.loc[:, ['age', 'group']] = df.loc[:, ['age', 'group']].astype(np.int64)

print('df:\n', df)

在这里插入图片描述

增加列

列的方向上增加----> 增加一列----> 给每个数据对象增加一个新的属性

df.loc[:, 'next_year_age'] = 20
print('df:\n', df)

在这里插入图片描述

如果直接这么增加,会导致增加的这一列值完全一样。那么在分析数据对象的不同点时,那么该列将无法区分数据对象的不同点! 如果这么增加列只能是用来占位

根据原有数据增加列

一般情况下的增加是通过对现有属性的计算、操作、提取等得到新的属性。

df.loc[:, 'next_year_age'] = df['age'] + 1
print('df:\n', df)

在这里插入图片描述

DataFrame修改数据

原始数据如下:
在这里插入图片描述

修改单个数据

取出数据后直接赋值(一般用不到)

df["age"]["stu0"] = 20
print('df:\n', df)

在这里插入图片描述

修改一列数据

直接修改(不建议),同样会导致增加的这一列值完全一样。

df['age'] = 20
print('df:\n', df)

在这里插入图片描述

一般情况下的修改是满足一定的条件才进行修改!

# 将年龄为奇数的同学的 小组 设置为 3!
msk = df['age'] % 2 != 0
print('msk:\n', msk)

df.loc[msk, 'group'] = 3
print('df:\n', df)

在这里插入图片描述

# 将 zs 同学的 年龄设置为 21
msk = df['name'] == 'zs'

df.loc[msk, 'age'] = 21
print('df:\n', df)

在这里插入图片描述

DataFrame删除数据

原始数据如下:
在这里插入图片描述

直接删除指定的行 或 列

ret = df.drop(
    labels=['group', 'age'],  # 要删除的行或者列的名称列表
    axis=1,  # 如果要删除的是列 --那么axis=1,如果要删除的是行,那么axis = 0
    inplace=False,  # 如果为True,则直接删除,对原df进行操作; 如果为False,那么返回一个结果,不会对原df操作!
)
print('df:\n', df)
print('ret:\n', ret)

df.drop(
    labels=['stu0', 'stu1'],
    axis=0,
    inplace=True
)
print('df:\n', df)

在这里插入图片描述

根据条件删除行 或 列

一般情况下的删除很少去删除某列属性,一般情况下都是删除指定条件下的数据对象!

# 删除 group为 1即 1组的学员
msk = df['group'] == 1
print('msk:\n', msk)
print("*"*20)

# 获取满足条件的索引
drop_labels = df.loc[msk, :].index
print('drop_labels:\n', drop_labels)
print("*"*20)

# 删除
df.drop(
    labels=drop_labels,
    axis=0,
    inplace=True
)
print('df:\n', df)

在这里插入图片描述

又或者反过来:保留不满足条件的数据对象

# 要删除 1组的学员---->理解为: 要保留 非1组的学员
msk = df['group'] != 1

# 取出非1组的学员
df = df.loc[msk, :]
print('df:\n', df)

在这里插入图片描述

  • 2
    点赞
  • 23
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
### 回答1: 要修DataFrame数据类型,可以使用astype()函数。该函数将列的数据类型转换为指定类型,并返回新的DataFrame。需要注意的是,astype()函数返回的新DataFrame必须重新赋值给原始DataFrame才能实现数据类型的修。例如: df['col'] = df['col'].astype('int') # 将‘col’列的数据类型转换为整型 另外,也可以在读取数据时指定数据类型,例如: df = pd.read_csv('data.csv', dtype={'col1': 'float', 'col2': 'int'}) # 将col1列的数据类型转换为浮点型,将col2列的数据类型转换为整型 ### 回答2: 在Python中使用Pandas时,经常需要修数据类型以满足不同的需求。Pandas提供了一个astype()方法来更数据类型,该方法基于指定的数据类型转换整个数据框的列。 首先,我们需要导入Pandas库并创建一个DataFrame: ```python import pandas as pd df = pd.DataFrame({'A': [1, 2, 3], 'B': ['4', '5', '6'], 'C': [7.1, 8.2, 9.3]}) ``` 此时数据框的数据类型如下所示: ```python print(df.dtypes) # 输出结果 # A int64 # B object # C float64 # dtype: object ``` 接下来,我们可以使用astype()方法来更数据类型。假设我们想将列B的数据类型更为整数,具体代码如下: ```python df['B'] = df['B'].astype(int) ``` 结果如下所示: ```python print(df.dtypes) # 输出结果 # A int64 # B int64 # C float64 # dtype: object ``` 在这个例子中,我们使用astype()方法将B列的数据类型更为int。如果我们想将多列数据类型更为相同的类型,可以使用以下代码: ```python df[['A', 'B']] = df[['A', 'B']].astype(float) ``` 此时,A和B两列的数据类型将被更为float。 需要注意的是,astype()方法将创建一个新的数据框来保存转换后的结果。原始数据框不会被更。如果我们想在原始数据框中进行更,则需要使用inplace参数,具体代码如下: ```python df['B'].astype(int, inplace=True) ``` 总的来说,使用astype()方法来更数据类型是非常简单和方便的。但要注意,在转换数据类型之前,需要确保数据没有任何错误,否则转换可能会失败并出现异常。 ### 回答3: Pandas是一个用于数据分析的流行Python库。其中的DataFrame是一种可以存储和处理表格数据数据结构。DataFrame由行和列组成,每个列可以有不同的数据类型。在使用DataFrame时,有时候需要修某一列或几列的数据类型,以便更好地进行分析。 下面是几种常见的修DataFrame数据类型的方法: 1. 使用astype()方法 astype()方法可用于将一个或多个列的数据类型转换为指定的类型。下面的代码演示了如何将“age”列的数据类型从整数转换为浮点数: ``` import pandas as pd df = pd.DataFrame({'name': ['Alice', 'Bob', 'Charlie'], 'age': [25, 30, 35]}) print(df.dtypes) # 输出数据类型 df['age'] = df['age'].astype(float) print(df.dtypes) # 输出修后的数据类型 ``` 2. 使用to_numeric()方法 如果需要将某一列的数据类型从字符串或其他格式的数据类型转换为数字类型,可以使用to_numeric()方法。下面的代码演示了如何将“age”列的数据类型从字符串转换为整数: ``` import pandas as pd df = pd.DataFrame({'name': ['Alice', 'Bob', 'Charlie'], 'age': ['25', '30', '35']}) print(df.dtypes) # 输出数据类型 df['age'] = pd.to_numeric(df['age'], errors='coerce').fillna(0).astype(int) print(df.dtypes) # 输出修后的数据类型 ``` 在这个例子中,使用了errors='coerce'参数,表示如果无法将字符串转换为数字,则将其转换为NaN。然后使用fillna()方法将NaN值替换为0,最后使用astype()方法将数据类型转换为整数。 3. 使用apply()方法 apply()方法可以用于对DataFrame中的一列或多列进行某种函数操作,从而数据类型。下面的代码演示了如何将“age”列的数据类型从整数转换为字符串: ``` import pandas as pd df = pd.DataFrame({'name': ['Alice', 'Bob', 'Charlie'], 'age': [25, 30, 35]}) print(df.dtypes) # 输出数据类型 df['age'] = df['age'].apply(str) print(df.dtypes) # 输出修后的数据类型 ``` 在这个例子中,使用了apply()方法将整数转换为字符串。 无论使用哪种方法修DataFrame数据类型,都需要注意数据类型的精确性和正确性,以确保分析结果的正确性。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

胡桃の壶

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值