Research&Paper
LarryNLPIR
专注NLP/IR/Machine Learning/Data Mining
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
ECIR 2016 Paper Modelling User Interest for Zero-query Ranking
中文简介:本文对智能个人助理(如Google Now,Microsoft Cortana)中的信息卡片排序进行了研究,从user modeling的角度提出了三组排序特征:implicit feedback features, entity based user interests features以及user demographic features. 其中entity features的提取用原创 2016-07-03 07:05:48 · 5223 阅读 · 0 评论 -
深度文本匹配开源工具(MatchZoo)
博主导言:苦于Deep Learning的baseline太多实现困难?苦于没有好的基于深度学习处理NLP, IR, QA任务的开源工具?苦于没有发布自己研究的深度文本匹配模型的交流平台?强烈推荐MatchZoo,用深度学习做自然语言处理,信息检索,智能问答等任务的小伙伴看过来。MatchZoo提供了基准数据集(TREC MQ系列数据、WiKiQA数据等)进行开发与测试,整合了当前最流行的深度文本转载 2017-12-10 23:32:04 · 16589 阅读 · 5 评论 -
SIGIR 2017 Paper Characterizing and Predicting Enterprise Email Reply Behavior
中文简介:本文对企业邮件系统中的用户行为进行了建模分析,首先分析了影响用户邮件回复行为的几类因素,然后基于分析结果建立了预测用户邮件回复行为和邮件回复时间的机器学习模型。基于Avocado邮件数据的实验结果表明,本文提出的特征和模型对于用户邮件回复行为的预测准确度大幅度超过了以往的基准方法。论文出处:SIGIR'17英文摘要:Email is still among the most popula原创 2017-08-28 23:17:46 · 2374 阅读 · 0 评论 -
CIKM 2016 aNMM: Ranking Short Answer Texts with Attention-Based Neural Matching Model
中文简介:本文针对当前深度学习模型包括基于CNN或者LSTM的模型适用于Answer Sentence Selection这个task时必须额外combine 传统的text matching feature的问题,提出了一个attention based neural matching model。该模型提出使用value-shared weighting scheme以及基于attention原创 2016-10-30 05:12:17 · 4095 阅读 · 0 评论 -
ICDM 2014 Paper ShellMiner Mining Organizational Phrases in Argumentative Texts in Social Media
中文简介: 本文提出了概率生成模型 Shell Topic Model (STM)对社交论坛文本中的组织性短语(Organizational Phrases)和主题词(topical contents)进行建模分析,主要的应用有组织性短语的挖掘和文档建模。论文出处:ICDM‘14.英文摘要:Threaded debate forums have become one of the major so原创 2016-07-03 07:18:49 · 5718 阅读 · 0 评论 -
ECIR 2016 Paper Beyond Factoid QA: Effective Methods for Non-factoid Answer Sentence Retrieval
中文简介:本文对non-factoid 问题的答案句子检索进行了研究,基于learning to ranking的框架,在传统文本匹配特征的基础上提出了给予语义匹配和上下文信息的特征,并且证明了这些特征对于答案句子检索的有效性。本文使用TREC GOV2数据集,并且开源了code和标注数据集,下载链接参见论文脚注。论文出处:ECIR'16.英文摘要: Retrieving finer graine原创 2016-07-03 06:56:46 · 5233 阅读 · 0 评论 -
CIKM 2013 Paper Modeling interaction features for debate side clustering
中文简介:本文对如何对网上论坛讨论中用户交互关系进行统计建模分析进行了研究。论文出处:CIKM‘13.英文摘要: Online discussion forums are popular social media platforms for users to express their opinions and discuss controversial issues with each othe原创 2015-12-23 23:19:03 · 4104 阅读 · 0 评论 -
CIKM 2013 Paper CQARank: Jointly Model Topics and Expertise in Community Question Answering
中文简介: 本文对如何在问答社区对用户主题兴趣及专业度建模分析进行了研究,并且提出了针对此问题的统计图模型Topics Expertise Model.论文出处:CIKM‘13.英文摘要: Community Question Answering (CQA) websites, where people share expertise on open platforms, have become原创 2015-12-23 22:48:04 · 4176 阅读 · 0 评论 -
Gradient Tree Boosting (GBM, GBRT, GBDT, MART)算法解析和基于XGBoost/Scikit-learn的实现
1. 概要Gradient Tree Boosting (别名 GBM, GBRT, GBDT, MART)是一类很常用的集成学习算法,在KDD Cup, Kaggle组织的很多数据挖掘竞赛中多次表现出在分类和回归任务上面最好的performance。同时在2010年Yahoo Learning to Rank Challenge中, 夺得冠军的LambdaMART算法也属于这一类算法。因此Tree Boosting算法和深度学习算法DNN/CNN/RNN等等一样在工业界和学术界中得到了非常广泛的应用。原创 2017-03-16 12:57:49 · 17679 阅读 · 3 评论 -
COLING 2014 Paper Generating Supplementary Travel Guides from Social Media
中文简介:想知道如何基于雅虎问答社区帖生成旅行指南吗?本文介绍了相关统计模型和技术。论文出处:COLING’14英文摘要: In this paper we study how to summarize travel-related information in forum threads to generate supplementary travel guides. Such summarie原创 2015-12-23 22:55:13 · 3180 阅读 · 0 评论 -
NAACL 2013 Paper Mining User Relations from Online Discussions using Sentiment Analysis and PMF
中文简介:本文对如何基于情感分析和概率矩阵分解从网络论坛讨论中挖掘用户关系进行了深入研究。论文出处:NAACL'13.英文摘要: Advances in sentiment analysis have enabled extraction of user relations implied in online textual exchanges such as forum posts. Howev原创 2015-12-23 23:12:47 · 3156 阅读 · 0 评论 -
ICTIR 2016 Analysis of the Paragraph Vector Model for Information Retrieval
中文简介:本文是对前面的SIGIR‘16工作的拓展, 主要是对PV model适用于IR的task时的三方面的问题进行了更加深入的分析,并且提出了针对这三个问题的相应改进。论文出处:ICTIR' 16英文摘要:Previous studies have shown that semantically meaningful representations of words and text can原创 2016-10-30 04:59:41 · 2496 阅读 · 0 评论 -
SIGIR 2016 Improving Language Estimation with the Paragraph Vector Model for Ad-hoc Retrieval
中文简介:本文对如何基于Paragraph Vector model改进Ad-hoc Retrieval task进行了分析,主要针对IR的场景提出了对PV model的三方面的改进。实验表明,改进后的模型进行检索的效果超过了基于topic model增强的LM的效果。论文出处:SIGIR'16英文摘要:Incorporating topic level estimation into原创 2016-10-30 04:44:32 · 1658 阅读 · 0 评论 -
论文发表-关于深度学习在问答系统和对话系统方面的应用研究-2018到2019年
作者导言:以下是我2018-2019年发表的关于深度学习在问答系统和对话系统的应用的paper,感兴趣的读者可以查阅。大家如果有关于这些paper的问题,欢迎发邮件到我的email (yangliuyx@gmail.com)咨询讨论,我会尽量回复。本来想对每一篇论文做细致的介绍,但是发现CSDN最近的博客编辑器不好用,所以先把近两年来发表的论文贴在这儿,以后有时间我会再更新,添加更多细节文字介绍。...原创 2019-06-08 01:32:19 · 3053 阅读 · 2 评论
分享