【作者结论】
-- > 把文本列中的所有英文逗号替换为中文逗号
-- > 更改文本格式为utf-8 BOM编码
--> 用WPS打开,成功(亲测可行)
1. 如果是码农,建议直接用notepad++查看,简单便捷,省去无数麻烦。
2. 如果是给其他人员看,那么需要借助excel或者WPS:
(1)Excel的缺点:需要先把csv文件从utf-8转码为ANSI,打开后中文才不会乱码,但是这会造成文本本身特殊符号、表情的乱码。因此,不推荐。
(2)WPS的优点:能够直接打开utf8格式的csv文件,无需转码。
二者共同的缺点都是,默认英文逗号为分隔符。这意味着,如果你的文本某一列内部含有英文逗号,用这两个工具打开后会发现一列文本分两列显示,数据极其不整齐。
如何解决:
方案一:管它三七二十一,直接把所有英文逗号统一换成中文逗号,哪怕本文是英文文本。【最推荐】
简单版本如下:
text = dic.get('text ', "").replace(",", ",")
注意英文逗号和中文逗号的区别(其实最终在csv中都显示为英文逗号&#x