《Mining Cross-Cultural Differences and Similarities in Social Media 》笔记

这篇博客是对ACL2018论文《Mining Cross-Cultural Differences and Similarities in Social Media》的解读,介绍了如何通过SocVec模型计算不同语言和文化背景下term的相似性和差异性。SocVec通过映射不同语言的word vectors到同一社会空间,解决跨语言计算相似度的问题。论文提出了两项任务:挖掘命名实体的跨文化差异和寻找俚语的跨文化相似性,并详细阐述了构建SocVec的过程和方法。
摘要由CSDN通过智能技术生成

此篇博客是关于一篇发表在ACL2018上的论文《Mining Cross-Cultural Differences and Similarities in Social Media》的阅读笔记。该博客主要用于叙述个人对于所读论文的理解,如有不对之处,欢迎各位批评指正!

在展开原文之前,我们首先需要了解在原文中出现的一些英语术语的含义:

culture:这里的culture不单纯指“文化”的含义,在本文中,它是以“国家”作为“culture不同”的标准。也就是说,英国和美国是两个culture,二者之间就可以看作是cross-cultural。但它们不是cross-lingual的,因为二者说的都是英语。但假设我们以中国和英国作为例子,那么二者之间既是cross-cultural的,又是cross-lingual的。本文探讨的就是基于后面这些情况的一些问题。

term:普通单词、命名实体和俚语都算作是term,本文重点讨论的是后两者。

简述:

1. 对于相同的一个命名实体(named entity),不同国家、不同语言的认往往能够有不同的见解和认识:

以上图为例,画红框处所表示的命名实体是“名古屋”(Nagoya)。由于一些历史原因,中国人对名古屋这个地方非常不满,因此评价会倾向于负面。而对于英国人而言,名古屋是他们旅游的一大去处,因此他们对于

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值