我在做这情感分析时差点吐血,另一份数据一次搞定,这一份数据死活搞不出来,始终只有两个空白文件。在网上查了相关资料讲是空行和空格的问题,但我把空行和空格删了后还是不行。在发现软件只会分析空行前的文本数据后,我就一半一半的测,直到最后测出是哪些句子有问题让我只能输出两个空白文件。最后测出来的那个句子出问题的原因是其空格是Tab的那种,所以单纯替换空格替换不掉这个,导致最后情感分析做不出来。
综上所述,对于Rost CM6.0情感分析的数据预处理,去掉换行,去掉两种空格,这样应该就可以了。
附个最后分析结果吧,泪目了,以后一定两种空格都检查。
05-03
1773
