纸上得来终觉浅,一直苦于没有小项目来看看锻炼下自己,相信很多初学编程的同学也一样,那就是不知道自己到底学的怎么样,而且也觉得没有一个实际的项目来帮助提高自己的实际动手能力,理论总是美好的,在实际的项目中会碰到这样那样的小问题,而且每一个问题都不是书上全部讲到的,就比如我将记录下来的,流程似乎很简单,但是实际操作起来却有很多的小问题,比如说文件的打开以及格式问题啊,数据的输出显示不出来字符啊,等等小问题的一步一步的解决,解决问题是一件很专注很认真的事情,也是一件有意思的事情。
很高兴这次有这样的机会,这次是一位同学,他需要对上前条评论,每个评论打分,来看看正负面情绪的比重,流程很简单:1:首先是平台从网上爬取这上千条评论,2:对这上千条评论做出出来,整合在一个文件中,3:对文件里面的每一条评论打分,然后吧每条评论的分数与评论结合在一起,一一对应起来。然后保存在文件中
流程很简单,但是操作起来小问题不断,以下是做情感分析的相关代码:
这一部分是对评论的处理:
import pandas as pd
inputfile = r'D:\数据分析实战\原始数据\JD_data.xlsx'
outputfile = r'D:\数据分析实战\原始数据\comment1.txt'
data = pd.read_excel(inputfile)