1.原因:
出现这种乱码的原因是放入ROSTCM6文件编码不对,ROSTCM6放入的编码必须是ANSI,所以到处的时候把格式设置为ANSI就可以了。
代码示例如下:
import pandas as pd
inputfile = '../data/meidi_jd_process_4.txt' #评论文件
outputfile = '../data/meidi_jd_process_5.txt' #评论处理后保存路径
data = pd.read_csv(inputfile, encoding='utf-8', header=None)
data.to_csv(outputfile, encoding='ANSI', header=None)
然后再用ROSTCM6进行情感分析得到的文件在pycharm中就可以正常显示了:
14 0 京东商城信得过 买的放心 用的省心、安心、放心
12 1 给公司宿舍买的 上门安装很快 快递也送的及时 不错的 给五分吧
24 2 美的值得信赖 质量不错
16 3 不错的哦 第一次在京东买这些产品 感觉相当好
30 5 自己动手安装的 买材料发了不到50块钱 自我感觉良好
1 7 还不错 就是快递有点慢 不打电话都不送
3 9 性价比高 下次还会光顾的
11 10 前天晚上定货 第二天早上就送货 下午马上就安装 速度超快 送货员态度很好 安装师傅也很好 免费帮忙拆旧机 配件费96元 不贵 总之很满意
10 11 该值得信任的品牌
8 12 价格便宜 购物方便快捷
6 13 帮同事买的他说不错 送货到家
4 14 用了一段时间了 好用 没什么问题
4 16 很好用 很方便 第二次购买了…
29 18 2个人洗澡的水还可以 再多就最好用大一