记录一下在数据处理上遇到的问题及解决方法
问题:pandas库中的删除方法
import pandas as pd
df=pd.read_csv('***.csv')
df.drop(index=,label=,inplace=,axis=)
drop函数在删除某一列或某一行上有很大作用。
遇到的问题,主要删除某一行时,执行了drop函数但文件里要删除的数据还存在。
其实导致这个问题的原因是,drop函数的label属性和index属性没分清。如果不是这个原因,那就是在完成一次删除操作时,没设置保存
label属性是可以删除行或列,传入的参数是行或列的name值。
index只可以删除行,传入的参数是行的name值。
一个很重要的事情
label属性和index属性传入的参数可以是列表
不需要把列表用循环解开。
还有就是需要在每次执行drop函数后
执行:
df.to_csv('***.csv',index=False)
index=False
可以避免再生成新的索引