在处理为微博文本的csv文件读取时报错,报错提示为:
原始代码为:
报错的意思大概时,utf-8 无法解码,在位置0处有非法字符。
在utf-8编码文件中bom在文件头部,占用三个字节,用来标示该文件属于utf-8编码,现在已经有很多软件识别bom头,但是还有些不能识别bom头,所以读取的时候就会出现报错。
解决方案:
用Notepad++软件把需要读取的文件打开,点击上方工具栏里的“编码”,将文件“ 转为UTF-8 无BOM格式编码 ”,再保存文件就解决了。
在处理为微博文本的csv文件读取时报错,报错提示为:
原始代码为:
报错的意思大概时,utf-8 无法解码,在位置0处有非法字符。
在utf-8编码文件中bom在文件头部,占用三个字节,用来标示该文件属于utf-8编码,现在已经有很多软件识别bom头,但是还有些不能识别bom头,所以读取的时候就会出现报错。
解决方案:
用Notepad++软件把需要读取的文件打开,点击上方工具栏里的“编码”,将文件“ 转为UTF-8 无BOM格式编码 ”,再保存文件就解决了。