第三章. Pandas入门—数据的增加，修改和删除

最新推荐文章于 2024-06-02 09:15:20 发布

归途^ω^

最新推荐文章于 2024-06-02 09:15:20 发布

阅读量1.7k

点赞数 6

分类专栏： Python数据分析从入门到实践--明日科技文章标签： pandas python 数据分析

本文链接：https://blog.csdn.net/weixin_45116749/article/details/127684404

版权

Python数据分析从入门到实践--明日科技专栏收录该内容

36 篇文章 18 订阅

订阅专栏

第三章. Pandas入门

3.6 数据的增加，修改和删除

1. DataFrame对象数据的增加：

1).按行增加数据：

  1).增加一行数据主要使用loc属性实现
  2).增加多行数据主要使用字典+append函数实现

import pandas as pd

pd.set_option("display.unicode.east_asian_width", True)
data = [[110, 115, 80], [93, 110, 92], [90, 68, 92], [106, 42]]
name = ['小明', '小美', '小强', '小王']
columns = ['语文', '数学', '英语']
df = pd.DataFrame(data=data, index=name, columns=columns)
print(df)
print('*' * 50)

# 增加一行数据
df.loc['小晓'] = [100, 98, 101]
print(df)
print('*' * 50)

# 增加多行数据
df_insert = pd.DataFrame({'语文': [80, 104, 99], '数学': [123, 56, 98], "英语": [108, 90, 112]}, index=['小小', '笑笑', '晓晓'])
#df1 = df.append(df_insert)//新版本中弃用
df1 = pd.concat([df,df_insert])
print(df1)
print('*' * 50)

结果展示:
在这里插入图片描述

2).按列增加数据：

  1).直接为DataFrame对象赋值
  2).使用loc属性在DataFrame对象的最后一列增加
  3).在指定位置插入一列

import pandas as pd

pd.set_option("display.unicode.east_asian_width", True)
data = [[110, 115, 80], [93, 110, 92], [90, 68, 92], [106, 42]]
name = ['小明', '小美', '小强', '小王']
columns = ['语文', '数学', '英语']
df = pd.DataFrame(data=data, index=name, columns=columns)
print(df)
print('*' * 50)

# 直接赋值操作
df['生物'] = [72, 89, 92, 68]
print(df)
print('*' * 50)

# 使用loc属性
df.loc[:, '历史'] = [100, 98, 101, 76]
print(df)
print('*' * 50)

# 使用insert进行插入
df_insert=[80, 104, 99,100]
df.insert(2, '物理', df_insert)
print(df)
print('*' * 50)

结果展示:
在这里插入图片描述

2. DataFrame对象数据的修改：

1).修改行标题：

  1).使用DataFrame对象中的index属性，直接赋值即可
  2).使用DataFrame对象中的rename方法

import pandas as pd

pd.set_option("display.unicode.east_asian_width", True)
data = [[110, 115, 80], [93, 110, 92], [90, 68, 92], [106, 42]]
name = ['小明', '小美', '小强', '小王']
columns = ['语文', '数学', '英语']
df = pd.DataFrame(data=data, index=name, columns=columns)
print(df)
print('*' * 50)

# 修改行标题
df.index = ['小明_new1', '小美_new1', '小强_new1', '小王_new1']
print(df)
print('*' * 50)

df2 = df.rename({'小明_new1': '小明_new2', '小美_new1': '小美_new2', '小强_new1': '小强_new2', '小王_new1': '小王_new2'}, axis=0,
                inplace=False)
print(df2)
print('*' * 50)

结果展示:
在这里插入图片描述

2).修改列标题：

  1).使用DataFrame对象中的columns属性，直接赋值即可
  2).使用DataFrame对象中的rename方法

import pandas as pd

pd.set_option("display.unicode.east_asian_width", True)
data = [[110, 115, 80], [93, 110, 92], [90, 68, 92], [106, 42]]
name = ['小明', '小美', '小强', '小王']
columns = ['语文', '数学', '英语']
df = pd.DataFrame(data=data, index=name, columns=columns)
print(df)
print('*' * 50)

# 修改列标题
df.columns = ['物理', '化学', '生物']
print(df)
print('*' * 50)

df2 = df.rename(columns={'物理': '政治', '化学': '历史', '生物': '地理'}, inplace=False)
print(df2)
print('*' * 50)

结果展示:
在这里插入图片描述

3).修改行列数据：

 主要利用DataFrame的loc属性

import pandas as pd

pd.set_option("display.unicode.east_asian_width", True)
data = [[110, 115, 80], [93, 110, 92], [90, 68, 92], [106, 42]]
name = ['小明', '小美', '小强', '小王']
columns = ['语文', '数学', '英语']
df = pd.DataFrame(data=data, index=name, columns=columns)
print(df)
print('*' * 50)

#修改整行
df.loc['小美'] = [80, 90, 100]
print(df)
print('*' * 50)

#修改整列
df.loc[:,'语文']=[50,60,70,80]
print(df)
print('*' * 50)

#修改某个数据
df.loc['小美','英语']=120
print(df)
print('*' * 50)

结果展示:
在这里插入图片描述

3. DataFrame对象数据的删除：

主要使用DataFrame对象中的drop方法，语法如下:

DataFrame.drop(labels=None, axis=0,index=None,columns=None, level=None, inplace=False, errors='raise')

参数说明:
labels：行标签或者列标签
axis：axis=0：按行删除，axis=1：按列删除，默认值为0
index：删除行，默认值为None
columns：删除列，默认值为None
level：针对两级索引的数据，level=0：按第一级索引删除整行数据 level=2：按第二级索引删除整行数据
inplace：可选参数，bool类型，inplace=True：原数组直接被替换掉，inplace=False：对原数组进行修改并返回一个新的数组，默认值为False
errors：参考值为raise或ignore，默认值为raise，errors=ignore，表示取消错误

1).删除行列数据：

import pandas as pd

pd.set_option("display.unicode.east_asian_width", True)
data = [[110, 115, 80], [93, 110, 92], [90, 68, 92], [106, 42]]
name = ['小明', '小美', '小强', '小王']
columns = ['语文', '数学', '英语']
df = pd.DataFrame(data=data, index=name, columns=columns)
print(df)
print('*' * 50)

# 删除整行
df1 = df.drop(['小明'], axis=0, inplace=False)
print(df1)
print('*' * 50)

# 删除整列
df2 = df.drop(['语文'], axis=1, inplace=False)
print(df2)
print('*' * 50)

# 删除特定条件的行
df3 = df.drop(df[df['数学'].isin([42])].index, inplace=False)#包含分数42分的行
print(df3)
print('*' * 50)

#删除特定条件的行
df4=df.drop(df[df['语文']<100].index,inplace=False)#删除语文分数小于100的行
print(df4)
print('*' * 50)