pandas数据处理
Yzy_gold
这个作者很懒,什么都没留下…
展开
-
pandas把nan替换
df = df.fillna(0.inplace=True)#替换为0df = df.fillna('',inplace=True)#替换为空字符串原创 2020-03-11 20:15:58 · 9659 阅读 · 1 评论 -
pandas将DataFrame中的重复项挑出
a = df.drop_duplicates(subset=['微博id'],keep='first')b = df.drop_duplicates(subset=['微博id'],keep=False)f=a.append(b).drop_duplicates(subset=['微博id'],keep=False)即将DataFrame中微博id这一series中的重复项挑出来了,f就...原创 2020-03-11 20:22:29 · 1637 阅读 · 0 评论 -
pandas处理文件打不开
在使用pd.read_csv的时候,报错说编码问题,试了各种问题,最后小伙伴给我说了用这个可以def re_encode(path): with open(path, 'r', encoding='GB2312', errors='ignore') as file: lines = file.readlines() with open(path, 'w', e...原创 2020-03-11 20:19:57 · 650 阅读 · 0 评论