自然语言处理
文章平均质量分 75
liyichen712
这个作者很懒,什么都没留下…
展开
-
随机森林
Bagging的策略从样本中重采样(有重复的)选出n‘个样本在所有属性上,对这n个样本建立分类器(ID3、C4.5、CART、SVM、Logistic回归等)重复以上两步m次,即获得m个分类器将数据放在这m个分类器上,最后根据这m个分类器的投票结果,决定数据属于哪一类随机森林在bagging基础上作了修改从样本集中用Boorstrap(一种有放回地抽样方法)采样原创 2016-06-14 16:31:35 · 302 阅读 · 0 评论 -
Towards Constructing Sports News from Live Text Commentary读书笔记
分享的这篇论文讲的主要是从体育赛事的直播文本当中自动生成新闻,个人对这个方向很感兴趣,而且也觉得这个方向非常具有研究前景,在这里简单谈一下我对这篇论文的看法。综述:作为该方向上的一个初步研究,作者将此作为一个特殊的文档摘要任务,采取句子抽取的方式来处理。将足球比赛的直播文本作为输入,基于LTR(Learning to Rank)模型利用传统的句子特征以及为该任务特别设计的句子特征来给句子打原创 2016-06-14 20:53:27 · 1251 阅读 · 0 评论