这里写自定义目录标题
一、read_csv遇到的坑
1、对于内容包含‘,’的数据,写入csv:
写入csv文件的时候使用其他分隔符,“|”,“\t” ," " 等。不然read_csv 用 delimiter =“,”会报错
pandas.errors.ParserError: Error tokenizing data. C error: Expected 4 fields in line 225, saw 6
2、对于内容包含‘,’的数据的读取
如果在read_csv时使用delimiter =“,”,d库为了避免歧义,自动会加上双引号到该句子中。
比如句子:严重问题,且售后态度差,不解决问题
该句会被转为带引号的:“严重问题,且售后态度差,不解决问题”
3、 读写csv,用的编码方式要一致,不然会报错
to_csv()方法的encoding参数默认为"gbk",而read_csv()方法的encoding参数默认为"utf-8",所以最好的防止由于编码出错导致读取错误的方法就是在to_csv()和read_csv()方法同时显式地设置相同的encoding参数。
r = pd.read_csv("test1.csv", index=None, sep=',',encoding= 'utf8')
r.to_csv("test1.csv",