很久时间没有更新博客了,这里我们一起回顾一下前面学习的深度学习的基本知识,然后进行一次实战分析。循环神经网络 ( R N N RNN RNN) 目前是自然语言处理中应用最为火热的一种神经网络,当然前提是不算上 G o o g l e Google Google 新开源的 B E R T BERT BERT , B E R T BERT BERT 相对于 R N N RNN RNN 准确率有很大提升,但是由于训练时间过长等原因,还没有大面积普及。
接下来我们实现在自然语言处理中应用的比较普遍的文本分类和情感分析,个人认为这两个属于同一类型,做法基本相同,我们使用 R N N RNN RNN 的变形 L S T M LSTM LSTM 来实现一个情感分析。
数据处理
我这里使用的数据是自己在京东上爬的小米8的好评/差评各400条,打好正负标签。
差评:
好评:
将好评、差评放在一起并打乱。
将每条评论使用词嵌入 ( E m b e d d i n g ) (Embedding) (Embedding) 向量化,实现方法可以参考深度学习(十)-AI起名,这里我就不再重复讲解了。
产生的部分词汇表:
商 品 不 错 , 京 东 让 我 很 失 望 < = > [ 671 , 15 , 1 , 33 , 166 , 13 , 5 , 232 ] 商品不错,京东让我很失望 <=> [671, 15, 1, 33, 166, 13, 5, 232] 商品不错,京东让我很失