云社区
>
云问答
>
问答详情
python如何对dataframe中行去重?
RT,自己随便写了个,显示错误为
ValueError: Can only compare identically-labeled DataFrame objects
但总感觉思路都错了....请指教一下
import pandas as pd
from pandas import DataFrame
L=[]
file=open('F:\\FCD\\实验文本.txt')
a=file.readlines()
for line in a:
L.append(line.split(','))
data=pd.DataFrame(L)
for i in range(len(data)):
for u in range(len(data)):
a=data[i:i+1]
b=data[u:u+1]
if u != i and a==b:
data.drop(data.index[[i,i+1]],inplace=True)
5327人浏览
收藏(0)
2个已发布回答
投票顺序
时间顺序
2018-06-09 23:00
直接用DataFrame.drop_duplicates()函数就可以
>>> from pandas import DataFrame
>>> data = DataFrame({'k': [1, 1, 2, 2]})
>>> data
k
0 1
1 1
2 2
3 2
>>> data = data.drop_duplicates()
>>> data
k
0 1
2 2
0 收
0
收藏(0)
2018-05-17 19:27
直接用DataFrame.drop_duplicates()函数就可以
>>> from pandas import DataFrame
>>> data = DataFrame({'k': [1, 1, 2, 2]})
>>> data
k
0 1
1 1
2 2
3 2
>>> data = data.drop_duplicates()
>>> data
k
0 1
2 2
0
收藏(0)
0/20000
添加图片:
注:最多添加4张图片,格式支持JPG、JPEG、PNG、GIF,每张图不超过8M
您还没有回答的权限!
登录后可参与回答,请
登录
或
注册