DataFountain疫情情绪分析(一)---数据预处理
一,数据读取1.下载到手里面的数据如果直接使用pandas或者numpy读取会出现各类编码问题,使用各种方法测试均失效,解决办法:先使用excel内置工具将文档转为csv-utf8格式,再使用pandas读取相关数据。2.相对于numpy的loadtxt,更推荐使用pandas的readcsv,少了相当一部分麻烦。二,数据预处理1.获取的文本中,对于情感标签官方规定只有-1,...
原创
2020-02-29 13:13:50 ·
1954 阅读 ·
0 评论