1.原因:
出现这种乱码的原因是放入ROSTCM6文件编码不对,ROSTCM6放入的编码必须是ANSI,所以到处的时候把格式设置为ANSI就可以了。
代码示例如下:
import pandas as pd
inputfile = '../data/meidi_jd_process_4.txt' #评论文件
outputfile = '../data/meidi_jd_process_5.txt' #评论处理后保存路径
data = pd.read_csv(inputfile, encoding='utf-8', header=None)
data.to_csv(outputfile, encoding='ANSI', header=None)
然后再用ROSTCM6进行情感分析得到的文件在pycharm中就可以正常显示了:
14 0 京东商城信得过 买的放心 用的省心、安心、放心
12 1 给公司宿舍买的 上门安装很快 快递也送的及时 不错的 给五分吧
24 2 美的值得信赖 质量不错
16 3 不错的哦 第一次在京东买这些产品 感觉相当好
30 5 自己动手安装的 买材料发了不到50块钱 自我感觉良好
1 7 还不错 就是快递有点慢 不打电话都不送
3 9 性价比高 下次还会光顾的
11 10 前天晚上定货 第二天