下面我来解释一下,关于.drop_duplicates()括号中inplace的问题。
drop_duplicates(inplace=True)是直接对原dataFrame进行操作。
而drop_duplicates(inplace=False)是重新创建一个新的DataFrame并进行删除,对原DataFrame不进行改变。
如:d.drop_duplicates(inplace=True) 则,对d中重复元素将被删除。drop_duplicates(inplace=False)将不改变原来的dataFrame,而将结果生成在一个新的DataFrame中。如:
t = d.drop_duplicates(inplace=False) 则,d的内容不发生改变,t的内容是去除重复后的内容。
ps:遇到的一点小问题解答
一.data = data.drop_duplicates()
二.data.drop_duplicates(inplace=True)
一和二是等效的,如果写一个data.drop_duplicates(),没有inplace属性并且没有赋值,那么就不会更改原DataFrame的值。即drop_duplicates()方法无效。