篇章分析
自动分析出文本中的段落层次结果 http://open.memect.cn/section
案例分析经过分析,有几种方法,比如分析每行间是否为最后一个字,还有标点符号,还有日期间隔。使用工具可以完成段落间的分割。
自动摘要
左侧为老师笔记,针对第一个,老师认为比较好用,第二个做得比较好的很少。
知识提取
文本相似度计算
已经有一些工具比较成熟,可以直接搜索github+博文进行使用。
这里老师介绍了一个关于“夹角余弦”的练习样例。
这个训练案例得到的结果还比较好。