上一篇文章记录了关于选取行列的知识,这次记录下关于如何删除行列。
源数据(data)如下:
Unnamed
首先是最简单的删除方法(drop)。
- 删除列
根据名称删除:
data_1
根据列顺序删除:
# 删除第二列到第三列
- 删除行
如果行索引为字符串,可以根据行名称删除,方法与列删除一样,只需将 axis 修改为 0.
根据行顺序删除:
# 删除第2行到第4行
这里有个inplace = True (False),实际上就是是否在原表上进行修改。
- 删除重复值
对于 DataFrame 的列,删除重复值,例如我现在要删除 JKD 列中重复元素所在的行。
data_1
如果我们想删除多列的重复值,例如下面的代码,这里的意思是删除 JKD 和 CDZ 列都相同的重复行。
data_1 = data.drop_duplicates(['JKD','CDZ'])
- 删除有指定字符串的行
例如我针对每行的 JKD 列,若该列的元素为‘西’,则删除该行。
data_1
数据也在上面,就不再贴上每步的处理结果了。