第三章. Pandas入门—数据的增加,修改和删除

第三章. Pandas入门

3.6 数据的增加,修改和删除

1. DataFrame对象数据的增加:

1).按行增加数据:

  1).增加一行数据主要使用loc属性实现
  2).增加多行数据主要使用字典+append函数实现
import pandas as pd

pd.set_option("display.unicode.east_asian_width", True)
data = [[110, 115, 80], [93, 110, 92], [90, 68, 92], [106, 42]]
name = ['小明', '小美', '小强', '小王']
columns = ['语文', '数学', '英语']
df = pd.DataFrame(data=data, index=name, columns=columns)
print(df)
print('*' * 50)

# 增加一行数据
df.loc['小晓'] = [100, 98, 101]
print(df)
print('*' * 50)

# 增加多行数据
df_insert = pd.DataFrame({'语文': [80, 104, 99], '数学': [123, 56, 98], "英语": [108, 90, 112]}, index=['小小', '笑笑', '晓晓'])
#df1 = df.append(df_insert)//新版本中弃用
df1 = pd.concat([df,df_insert])
print(df1)
print('*' * 50)

结果展示:
在这里插入图片描述

2).按列增加数据:

  1).直接为DataFrame对象赋值
  2).使用loc属性在DataFrame对象的最后一列增加
  3).在指定位置插入一列
import pandas as pd

pd.set_option("display.unicode.east_asian_width", True)
data = [[110, 115, 80], [93, 110, 92], [90, 68, 92], [106, 42]]
name = ['小明', '小美', '小强', '小王']
columns = ['语文', '数学', '英语']
df = pd.DataFrame(data=data, index=name, columns=columns)
print(df)
print('*' * 50)

# 直接赋值操作
df['生物'] = [72, 89, 92, 68]
print(df)
print('*' * 50)

# 使用loc属性
df.loc[:, '历史'] = [100, 98, 101, 76]
print(df)
print('*' * 50)

# 使用insert进行插入
df_insert=[80, 104, 99,100]
df.insert(2, '物理', df_insert)
print(df)
print('*' * 50)

结果展示:
在这里插入图片描述

2. DataFrame对象数据的修改:

1).修改行标题:

  1).使用DataFrame对象中的index属性,直接赋值即可
  2).使用DataFrame对象中的rename方法
import pandas as pd

pd.set_option("display.unicode.east_asian_width", True)
data = [[110, 115, 80], [93, 110, 92], [90, 68, 92], [106, 42]]
name = ['小明', '小美', '小强', '小王']
columns = ['语文', '数学', '英语']
df = pd.DataFrame(data=data, index=name, columns=columns)
print(df)
print('*' * 50)

# 修改行标题
df.index = ['小明_new1', '小美_new1', '小强_new1', '小王_new1']
print(df)
print('*' * 50)

df2 = df.rename({'小明_new1': '小明_new2', '小美_new1': '小美_new2', '小强_new1': '小强_new2', '小王_new1': '小王_new2'}, axis=0,
                inplace=False)
print(df2)
print('*' * 50)

结果展示:
在这里插入图片描述

2).修改列标题:

  1).使用DataFrame对象中的columns属性,直接赋值即可
  2).使用DataFrame对象中的rename方法
import pandas as pd

pd.set_option("display.unicode.east_asian_width", True)
data = [[110, 115, 80], [93, 110, 92], [90, 68, 92], [106, 42]]
name = ['小明', '小美', '小强', '小王']
columns = ['语文', '数学', '英语']
df = pd.DataFrame(data=data, index=name, columns=columns)
print(df)
print('*' * 50)

# 修改列标题
df.columns = ['物理', '化学', '生物']
print(df)
print('*' * 50)

df2 = df.rename(columns={'物理': '政治', '化学': '历史', '生物': '地理'}, inplace=False)
print(df2)
print('*' * 50)

结果展示:
在这里插入图片描述

3).修改行列数据:

 主要利用DataFrame的loc属性
import pandas as pd

pd.set_option("display.unicode.east_asian_width", True)
data = [[110, 115, 80], [93, 110, 92], [90, 68, 92], [106, 42]]
name = ['小明', '小美', '小强', '小王']
columns = ['语文', '数学', '英语']
df = pd.DataFrame(data=data, index=name, columns=columns)
print(df)
print('*' * 50)

#修改整行
df.loc['小美'] = [80, 90, 100]
print(df)
print('*' * 50)

#修改整列
df.loc[:,'语文']=[50,60,70,80]
print(df)
print('*' * 50)

#修改某个数据
df.loc['小美','英语']=120
print(df)
print('*' * 50)

结果展示:
在这里插入图片描述

3. DataFrame对象数据的删除:

主要使用DataFrame对象中的drop方法,语法如下:

DataFrame.drop(labels=None, axis=0,index=None,columns=None, level=None, inplace=False, errors='raise')

参数说明:
labels:行标签或者列标签
axis:axis=0:按行删除,axis=1:按列删除,默认值为0
index:删除行,默认值为None
columns:删除列,默认值为None
level:针对两级索引的数据,level=0:按第一级索引删除整行数据 level=2:按第二级索引删除整行数据
inplace:可选参数,bool类型,inplace=True:原数组直接被替换掉,inplace=False:对原数组进行修改并返回一个新的数组,默认值为False
errors:参考值为raise或ignore,默认值为raise,errors=ignore,表示取消错误

1).删除行列数据:
import pandas as pd

pd.set_option("display.unicode.east_asian_width", True)
data = [[110, 115, 80], [93, 110, 92], [90, 68, 92], [106, 42]]
name = ['小明', '小美', '小强', '小王']
columns = ['语文', '数学', '英语']
df = pd.DataFrame(data=data, index=name, columns=columns)
print(df)
print('*' * 50)

# 删除整行
df1 = df.drop(['小明'], axis=0, inplace=False)
print(df1)
print('*' * 50)

# 删除整列
df2 = df.drop(['语文'], axis=1, inplace=False)
print(df2)
print('*' * 50)

# 删除特定条件的行
df3 = df.drop(df[df['数学'].isin([42])].index, inplace=False)#包含分数42分的行
print(df3)
print('*' * 50)

#删除特定条件的行
df4=df.drop(df[df['语文']<100].index,inplace=False)#删除语文分数小于100的行
print(df4)
print('*' * 50)

结果展示:
在这里插入图片描述
在这里插入图片描述

  • 6
    点赞
  • 12
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值