数据替换
可以选择使用loc进行对指定位置元素赋值,也可以使用replace()函数对特定元素进行替换。
创建一个DataFrame
import numpy as np
import pandas as pd
df = pd.DataFrame(np.arange(16).reshape((4,4)),index = list('abcd'),columns=['A','B','C','D'])
df
- 定位替换
根据提供的行列索引,对定位值进行替换
'''将行列为'a','A'的对应值赋值为1'''
df.loc['a',"A"]=1
df
# 返回
A B C D
a 1 1 2 3
b 4 5 6 7
c 8 9 10 11
d 12 13 14 15
- 定位条件替换
根据提供的条件和索引,对数据进行赋值
'''将A列,大于5的值替换成1'''
df.loc[df['A']>5,'A']=1
df
# 返回
A B C D
a 0 1 2 3
b 4 5 6 7
c 1 9 10 11
d 1 13 14 15
- replace函数替换
通过replace函数,对数据进行替换。
单列单值替换
'''将A列中0替换成10'''
df[['A']].replace(0,10)
# 返回
A
a 0
b 4
c 8
d 0
单列多值替换
'''将将A列中0替换成10,4替换成20'''
df[['A']].replace([0,4],[10,20])
# 返回
A
a 10
b 20
c 8
d 12
多列相同值替换规则
'''将将A、B列中0替换成10,4替换成20'''
df[['A','B']].replace([0,1],[10,20])
# 返回
A B
a 10 20
b 4