1 dataframe 对于某一列去重
f = f.drop_duplicates(subset='名称')
2 csv文件名中有中文
f = open('中文.csv','r',encoding='utf-8')
f= pd.read_csv(f)
3 两个dataframe合并
dataframe1.append(dataframe2)#两个dataframe样式完全一样
dataframe = dataframe1.join(dataframe2,on = 'key')#两个dataframe样式不一样,根据外键链接在一起
4 python保存文件时,是将数据写入缓存区,当缓存区满之后一次性写入文件,如果想按行每次都直接写入不进入缓存区使用with open ,因为在每次写入之后会自动关闭文件
with open('文件名.txt', 'a', encoding='utf-8') as f:
f.writelines([i, '\n'])
5 正则表达式:在处理文件中特别是处理大量冗余数据时,需要用到正则表达式。记录两个正则表达式比较好的网站:正则表达大全、正则表达式在线测试
6 在列表转字符串中,如果列表中有不是string的对象,使用” “.join(list) 就会报错
TypeError: sequence item 0: expected str instance, float found
7 对dataframe对象进行增删操作后,其对应的index会改变,如果还直接按照增删前的index进行操作就会报错找不到该索引