前言
循环神经网络(Recurrent Neural Networks,RNNs)目前在自然语言处理领域中的格外受欢迎。
很多简单的自然语言处理任务可以直接由RNN来完成。
这里列出几种RNN在自然语言处理领域的应用算法,以供参考。(目前只列出了参考代码,后续会补上相关说明。)
正文
中文分词算法
具体代码参考github
命名实体识别算法
具体代码参考github
文本生成算法
这里内容比较多,详见后一篇博客。
后记
分词算法的关键有两个,算法和词典。缺了其中一个,效果都不会太好,可惜现在互联网上公布的标注语料库太少了,希望将来能做一份贡献吧。
语言处理领域中的很多问题(分词、命名实体识别等)都可以转换为序列标注问题,而序列标注这样的上下文关系较紧密的问题由RNN来处理再适合不过了。