一、适用于数值型
判断标准差是否为0,为0表示该列值全部相同。
代码:
data.drop(data.columns[data.std() == 0], axis=1, inplace=True)
二、适用于所有类型
1. 一行代码实现
代码:
data = data.loc[:, (data != data.iloc[0]).any()]
解析:
- data != data.iloc[0]:将所有数据与第一行数据进行比较,结果返回一个与data结构相同的DataFrame,元素类型为bool。
- any():对一列进行判断,如果全为False,返回False。
- data.loc[]:通过条件查看。:代表查看所有行,(data != data.iloc[0]).any()代表查看返回值为True的一列
2. 使用describe方法
当元素类型为字符串时,使用describe方法,返回值中有一个unique索引,可以使用它来实现。
代码:
# 需要先将表中所有元素转换为字符串
desc = data.astype('str').describe()
# 判断unique的值是否为1
mask = desc.loc['unique',:] == 1
# 删除返回值为True的列
data.drop(labels=desc.columns[mask],axis=1,inplace=True)
desc打印结果为