嗯…,这个项目我自己调了快一个星期,最终在昨晚把代码跑通了,然后在今天早上又解决了两三个bug,总的来说,bingo思密达~
突然发现调试程序还挺有趣的(ps:当然仅仅是在调出来的那一刻,看见数据在飞奔地运行,畅快=.=)
OK,下面先说一下项目的流程:
首先,当然是文本预处理
输入文本,在将输入文本转化成向量之前,我们需要将标点符号、括号、问号等删去,只留下字母、数字和字符, 同时将大写字母转化为小写,去除停用词。
效果如下图
然后就是将文本转化为词向量(即汉字要转化为计算机能识别的数字类(矩阵啥的))
在将深度学习运用于文本情感分析的过程中,我们需要考虑网络模型的输入数据的形式。在其他例子中,卷积神经网络(CNN)使用像素值作为输入,logistic回归使用一些可以量化的特征值作为输入,强化学习模型使用奖励信号来进行更新。通常的输入数据是需要被标记的标量值。当我们处理文本任务时,可能会想到利用这样的数据管道。
但是,这样的处理方式存