python读取txt数据,TXT数据中存在中文,格式如下:
data = pd.read_csv('F:/2008.txt',sep=',')
报错
则需加入" encoding=‘gbk’ "
中文字符的Unicode编码0x0800-0xFFFF之间,(utf-8包含了部分汉字),当你试图将该“中文字符”转成U码的utf-8时超出了其范筹而GBK 规范收录了 ISO 10646.1 中的全部 CJK 汉字和符号,并有所补充,所以解决方法是将.decode(‘utf-8’)改为.decode(‘gbk’)
data = pd.read_csv('F:/2008.txt',sep=',',encoding='gbk')