1.将DataFrame所有元素替换的方法参考:https://www.jianshu.com/p/2557a805211f
注意:df1.replace("女",0,inplace=True):replace替换只能是完全匹配才可以,如果不完全匹配无法替换,且不会报错。
可以把语句加一个参数:
df1.iloc[:,5:15]=df1.iloc[:,5:15].replace("准","5",regex=True)(好像还得赋个值,要不然整不了)
2.pandas显示一列中的不同值:
比如说有一个名为 df1 的dataframe
要统计某一列(比如说列名是city)中各个值出现的次数
#可以通过df.colname 来指定某个列,value_counts()在这里进行计数
df2 = df1.city.value_counts()
print(df2)
- 1
- 2
- 3
还有一个是统计出现的个数: df.nunique(),
df.nunique()
a 4
b 5
c 1
dtype: int64
# df1['前二终端品牌'] = df1['前二终端品牌'].value_counts()
df1.rename(columns={'前二终端品牌':'second_band'}, inplace = True)
df3=df1.second_band.value_counts()
df3
3.修改某列的列名:
使用rename函数可以只修改特定列的名称,不需要修改的则不用管。
>>>a.rename(columns={'A':'a', 'C':'c'}, inplace = True) #inplace的意思是在原DataFrame上完成 >>>a a B c 0 1 4 7 1 2 5 8 2 3 6 9