AMiner平台(https://www.aminer.cn)由清华大学计算机系研发,拥有我国完全自主知识产权。平台包含了超过2.3亿学术论文/专利和1.36亿学者的科技图谱,提供学者评价、专家发现、智能指派、学术地图等科技情报专业化服务。系统2006年上线,吸引了全球220个国家/地区1000多万独立IP访问,数据下载量230万次,年度访问量超过1100万,成为学术搜索和社会网络挖掘研究的重要数据和实验平台。
必读论文:https://www.aminer.cn/topic
论文集地址:https://www.aminer.cn/topic/60696ea392c7f9be215d6bca
近年来,深度学习在自然语言处理领域获得了巨大的成功。但是,质疑声也一直不绝于耳,尤其是关于深度学习容易学习到语言数据集上的伪关系(spurious relation)的问题一直没有得到解决。因果推断理论告诉我们,这是由于混杂因子(confounding)造成的。然而,将因果推断方法应用到自然语言处理目前仍然面临着一些困难:什么是自然语言当中的随机变量?如何从表示中找出混杂因子?如何让学习结果更加稳定,避免受训练集中的伪关系影响?其中最大的困难,在于如何定义自然语言中的因果关系。
该论文集共收录11篇论文,引用最多的论文为Causal reasoning in the comprehension of simple narrative texts,引用数为163。
AMiner,一个具有认知智能的学术搜索引擎:https://www.aminer.cn
#AMiner# #论文#