IJCI-2013自然语言过程部分文章推荐

北京大学SIGMA小组

于 2013-08-25 15:14:52 发布

阅读量1.5k

点赞数

分类专栏： zhangxiong

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/pku_sigma/article/details/10301543

版权

zhangxiong 专栏收录该内容

2 篇文章 0 订阅

订阅专栏

Integrating Syntactic and Semantic Analysis into the OpenInformation Extraction Paradigm

目标: Open Information Extraction (OIE) paradigm,即从大型语料库中提取关系.

关键点:之前的文章往往仅仅提取语料库上下文的文本信息,来进行关系的判别.本文提出将句法,语法分析的结果也作为特征,进行分类.

方法:

1.用句法分析得到的特征关系识别过程的质量.

2.用语法分析整合到语法分析之中,从而将同义的关系综合起来,形成成熟的含有语义的关系库.

3.对每一个关系增加语义标签.

Learning Topical Translation Model for Microblog HashtagSuggestion

目标:微博的标签推荐

关键点:微博长度短,标签本身可能不会出现在微博之中,需要以翻译的方法去做这件事情,即将微博本身的信息与标签看作两种不同的语言.标签推荐就成为一个翻译的过程.而二者之间的联系由公共的主题完成.

方法:以主题翻译模型完成标签的推荐.

Leveraging Multi-Domain Prior Knowledge in Topic Models

目标:提升主题模型的效果

关键点:最初的主题模型是无监督的学习,所给出的主题难以被人所理解.为了解决这一问题,有了基于先验知识的主体模型,提升了效果.但是,各个领域的知识难以结合起来一起提升主体模型.

方法:本文首先提出一个语义集的概念,同一个语义集内的单词有同样的主题分布.不同的先验知识库都可以转换为语义集的形式.这样就形成了单词-语义集-主题的三层主题模型,这一模型可以自我形成新的语义集,从而达到将不同领域的先验知识结合的目的.

PPSGen: Learning to Generate Presentation Slides for AcademicPapers

目标:对于一篇论文自动形成PPT

关键点:PPT中的每句话,每个段落之间都有着很强的逻辑关系,不能简单地用摘要的方法去做.

方法:

1.用线性回归的方法标出每句话的重要程度

2.用Integer Linear Programming方法去挑选语句,并将关键词与关键句排列.

北京大学SIGMA小组

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
2
评论
IJCI-2013自然语言过程部分文章推荐

Integrating Syntactic and Semantic Analysis into the OpenInformation Extraction Paradigm目标: Open Information Extraction (OIE) paradigm,即从大型语料库中提取关系.关键点:之前的文章往往仅仅提取语料库上下文的文本信息,来进行关系的判别.本文提出将句法,语法分析
复制链接

扫一扫

专栏目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。