总结:《TOPIC SEGMENTATION IN ASR TRANSCRIPTS USING BIDIRECTIONAL RNNS FORCHANGE DETECTION》
最近在考虑把大段的无结构文本通过机器学习或深度学习的方法进行分割自然段或子话题段的事情。这是自然语言处理的一个分支,该分支有很大的工业意义。主要应用有语音转录文本分自然段、辅助文本摘要、阅读理解等。 先看今天这个论文。该论文还是在计算上下文相似度的基础上进行文本分段落。直接从论文的第二部分开始,介绍了论文中用到的模型结构。输入是以英文单词为一个token的句子,Fig1中的就是...
原创
2020-03-05 23:54:46 ·
460 阅读 ·
0 评论