密歇根大学裴嘉欣:量化语言亲密度

研究者提出了量化语言亲密度的标注方法和NLP模型,利用大规模数据研究了性别、社交距离和匿名性对语言亲密程度的影响。实验表明,亲密度在最亲近和最疏远的关系中更显著,女性参与的对话通常更亲密,匿名性可能允许人们提问更私密的问题,而特定的语言技巧如swearing和hedging能提高亲密度。
摘要由CSDN通过智能技术生成

⬆⬆⬆              点击蓝字

关注我们

AI TIME欢迎每一位AI爱好者的加入!

亲密度这一概念来源于社会心理学,主要被用来描述人和人之间关系 (eg. 朋友) 或者互动 (eg. 亲吻) 的亲密程度。我们将这一概念沿用到了语言中,用来描述人际交流中所使用语言的亲密程度,比如 “我今天心情真的好差” 比 “吃了吗” 一般来说具有更高的语言亲密度,因为它涉及到了更个体化的情绪表达;而 “你最糟糕的童年回忆是什么” 则比 “你觉得新的苹果手机怎么样” 要更加亲密,因为它过于私密和个人化。

在这一研究中,我们提出了一套量化语言亲密度的数据标注方法和一个用于测量语言亲密度的NLP模型,并使用八千万 Reddit、Twitter、书籍和电影对话数据研究了性别、社交距离和匿名性对于人际交流中语言亲密度的影响。

裴嘉欣密歇根大学二年级博士生,研究方向为计算社会科学,目前主要关注自然语言处理和社会心理学的结合。

一、 让陌生人相爱的36个问题

1997年,美国心理学家阿瑟·亚伦(Arthur Aron)等人发表了一项研究,他们发现彼此询问一些特别亲密的问题,可以快速增强两个陌生人之间的亲密度。这一研究在被纽约时报报道后,也在中文互联网上被广泛转载,并被宣传为快速让心上人爱上你的良方。然而当人们在现实生活中面对心上人的时候,却会对这些问题大失所望,因为就像知乎上最高赞的评论所言,这些在实验室中效果良好的问题,在真实的生活中却很难找到合适的场景或契机。

图1

图1中的问题同其他稀松平常的诸如“吃了没”这样的寒暄有什么区别?又究竟有哪些因素最终影响着人们在日常生活中的语言表达呢?这里引入了社会心理学中亲密度的概念来解释。

亲密度作为一种index:一方面,可以去表示人和人之间的一种关系的亲密度;另一方面,也可以表示人和人之间交互的亲密度,比如在街上对任何的陌生人问路。语言亲密度受到了广泛的社会和个体因素的约束,而违反这样的约束则往往会造成尴尬,或者带来更严重的后果。

因此,讲者提出本研究的两个主要问题:

第一,能否量化语言的亲密度;

第二,在社会生活中有哪些社会规范影响着人们在真实生活中关于语言亲密度的表达。

讲者主要从以下三个方面介绍:

1) 如何标注语言数据亲密度?

2) 如何使用NLP模型测量语言亲密度?

3) 验证基于社会规范的结论。

二、社会规范如何影响人际交流?

 

语言数据亲密度标注的目标是

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值