pandas DataFrame 中按条件筛选或去重后,需要重新定义index,否则会出现index错误
看了那么多博客,真的没几个能写到点上的,查了半天,试了半天,结果就一句话搞定。
test_df = test_df.reset_index(drop=True)
到这里有基础的大部分就知道怎么解决的,节约大家时间。
不懂的,我写一个完整的。
# 主要是想通过字符串长度对df进行筛选,但是没有想到什么好的方法可以直接筛选,于是就用了个笨方法,加入了一个长度列
test_df = pd.read_csv('test.csv', encoding='utf-8')
test_df['len'] = test_df['content'].apply(len)
test_df = test_df[test_df['len'] > 1]
test_df = test_df.reset_index(drop=True)
祝大家此生没有bug,即使有,也可以很快解决。