在pandas
中,DataFrame
对象提供了丰富的方法来进行数据的增删改查操作。以下是一些常用的操作:
数据的增加(增)
-
添加新列:
可以通过直接赋值的方式给DataFrame
添加新列。import pandas as pd df = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6]}) df['C'] = [7, 8, 9] # 添加新列C
-
添加新行:
可以使用loc
索引器或append
方法添加新行。df.loc[3] = [4, 5, 6] # 使用loc添加新行,指定行号 new_row = pd.DataFrame({'A': 4, 'B': 5, 'C': 6}) df = df.append(new_row, ignore_index=True) # 使用append添加新行
数据的删除(删)
-
删除列:
可以使用drop
方法删除指定的列。df.drop('C', axis=1, inplace=True) # 删除列C,axis=1表示操作的是列
-
删除行:
可以使用drop
方法删除指定的行。df.drop(0, axis=0, inplace=True) # 删除第一行,axis=0表示操作的是行
数据的修改(改)
-
修改列名:
可以重新赋值给DataFrame
的columns
属性来修改列名。df.columns = ['X', 'Y', 'Z'] # 将列名A, B, C改为X, Y, Z
-
修改数据:
可以直接通过索引或loc
来修改数据。df.loc[0, 'A'] = 10 # 修改第一行A列的值为10 df.at[0, 'B'] = 20 # 修改第一行B列的值为20,at用于单个元素的修改
数据的查询(查)
-
查询数据:
可以使用.loc
和.iloc
来进行数据查询。# 通过.loc查询第二行第二列的值 value = df.loc[1, 'B'] print(value) # 通过.iloc查询第二列第三行的值 value = df.iloc[2, 1] print(value)
-
条件查询:
可以使用布尔索引进行条件查询。# 查询A列大于2的所有行 filtered_df = df[df['A'] > 2]
-
排序查询:
可以使用sort_values
方法对数据进行排序查询。# 根据A列的值升序排序 sorted_df = df.sort_values(by='A')