- 博客(8)
- 收藏
- 关注
翻译 抽取式文档摘要方法(二)
1、基于有监督学习的方法可考虑众多因素,由机器学习算法确定句子重要性 句子分类 二类分类:句子是否隶属于摘要 SVM(支持向量机) 序列标注 为每个句子打上标签 可考虑相邻句子之间的关系 HMM(隐马尔科夫模型),CRF(条件随机场) 句子回归 为每个句子预测一个反映重要性的分数 SVR(支持向量回归)2、基于神经网络的方法 基于编码器-解码器框架进行单文档摘要 编码器:
2017-11-29 13:17:28 4717
翻译 抽取式文档摘要方法(一)
1、抽取式从文档中抽取已有句子形成摘要实现简单,能保证句子的可读性可看作一个组合优化问题可与语句压缩一并进行(可看作混合式方法)2、抽取式文档摘要的关键技术:重要信息评估、冗余信息的过滤、碎片化信息的聚合、多源信息的篇章组织其中单文档摘要主要集中于重要信息评估 多文档摘要则集中于四个方面关键问题 如何衡量句子重要性? 影响句子重要性的因素 句子长度 句子位置 句子中词语的
2017-11-28 21:09:23 18707
翻译 摘要质量评价
1、自动评价高效、一致性好、节省人力时间,但不精确 1)ROUGE 类似BLEU,基于N元模型自动评价系统摘要与人工摘要的吻 合程度 ROUGE-N, ROUGE-SU4ROUGE(Recall-Oriented Understudy for Gisting Evaluation),在2004年由ISI的Chin-Yew Lin提出的一种自动摘要评价方法,现被广泛应用于DUC(Docume
2017-11-28 19:26:57 2585
原创 文本摘要简介
1、信息摘要任务定义:对海量数据内容进行提炼与总结,以简洁、直观的摘要来概括用户所关注的主要内容,方便用户快速了解与浏览海量内容。2、文本摘要的应用:文献自动索引、新闻信息服务、信息检索 (关键词抽取可看做是文档摘要的一个特例)3、摘要长度1)根据需要由用户指定 摘要与原文的比例 :10%, 20%, … 摘要的词数或字节数: 100 words, 250 words, 665 bytes
2017-11-28 19:04:24 755
转载 ubuntu几款好用的代码编辑器
https://jingyan.baidu.com/article/4e5b3e1920d2e091901e2436.html
2017-11-27 21:30:15 42874 2
转载 tensorflow安装
https://www.leiphone.com/news/201606/ORlQ7uK3TIW8xVGF.html其中安装的最后一条命令容易失败,可以延长限制时间,使用如下命令: sudo pip –default-timeout=1000 install –upgrade https://storage.googleapis.com/tensorflow/linux/cpu/tensorfl
2017-11-27 13:57:57 166
转载 ubuntu编辑网络配置文件后如何保存?
Ubuntu 的网络配置文件主要有以下几个:IP地址配置文件、主机名称配置文件、DNS配置文件。 IP地址配置文件: /etc/network/interfaces 打开后里面可设置DHCP或手动设置静态ip。前面auto eth0,让网卡开机自动挂载. 1. 以DHCP方式配置网卡 编辑文件/etc/network/interfaces: sudo vi /etc/network/int
2017-11-27 13:35:43 8409
转载 Unable to locate package错误解决办法
sudo apt-get update等上面命令执行完后,再执行sudo apt-get install就可以了!其实错误信息已经很明确了,Unable to locate packet就是无法找到包嘛,那还不赶紧sudo apt-get update下!
2017-11-27 13:00:58 5789
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人