论文:在COVID-19大流行期间,美国公众对个人使用口罩的意见两极分化

一、本篇论文链接:https://arxiv.org/pdf/2011.00336.pdf

二、内容

作者调查了不同属性、不同阶层、不同社会身份的人对于口罩使用的态度,相当于对推特的用户进行了一次全面的用户画像,并且归纳出十大有趣的发现,例如:

女生比男生对口罩佩戴的态度更加积极,男生相对不爱戴口罩;

美国东西海岸相对于南部和中西部地区对口罩佩戴的态度更加积极,这可能与人口密度有关;

白种人对口罩佩戴存在严重不满的情绪,而东亚和印度人则展现出非常积极的态度…

罗杰波教授指出,这项工作的意义在于,更加明确哪种类型的人对于口罩使用持消极的态度,从而有针对性的实施措施去劝说特定人群佩戴口罩(或者采用其他防护措施)。

罗杰波教授团队的调查方式不是通过传统的调查问卷,而是美国人的“国民级应用”Twitter。采用此应用上用户发表的一些言论,当作需要训练的数据。这项数据的收集很重要也很复杂。

事实上,Twitter已经被证实是分析和预测各种大型社会事件的一个有价值的数据来源,比如美国的大选。在2009年H1N1和2014年埃博拉病毒流行期间,Twitter也被用来监测公众对这些重要事件的情绪。但涉及到用户的隐私,因此这些数据的利用需要被监管。

研究的本意是:data science for social good,事社会朝着好的方向发展。传统的“人肉调查”的方式已经不适应时代的需求,技术或许能够为研究者带来福音。大数据的挖掘与分析能达到更好的效果。

罗杰波教授团队巧妙地应用了Twitter这一大众媒介,结合大数据与人工智能,来探索人们在Twitter上对于COVID-19期间口罩使用的看法。社交媒体挖掘研究过程中的主要难题在于数据收集处理和方法。

首先,数据收集的难度很大,必须有足够数量级而且足够质量的推特用户及其推文。据雷锋网了解,从2020年1月11日到2020年8月10日,团队总共收集了120万条涉及口罩相关词汇的推文,解决方法包括关键字搜索和算法辅助半自动过滤。

其次,人口统计学中的最重要的信息就是用户属性, 包括用户的年龄、性别、种族、地区、收入等等。

团队利用鲁棒的人工智能算法(包括用户头像分析、自然语言处理、多模态协同推理)对相关属性进行自动分类标签,有效地解决了这些信息无法直接获取的困难。
在这里插入图片描述
梳理完数据后,团队使用LDA主题模型对有关口罩使用的推文 (tweets) 进行主题归纳,主要发现有四个主题:学校和工作单位的口罩佩戴情况、政府口罩政策、疫情期间的事件和活动,以及公众健康关爱。

这项研究中特别值得注意的一点是使用离线变点搜索算法检测用户基于时间轴对口罩使用的情感转变关键点,并从中引申出不同口罩使用政策的推出实施对于不同党派用户对口罩使用的情感变化的显著影响。

相对于在线变点检测方法,离线变点检测在接受所有的数据点后才对数据进行变点检测,这将提供比在线变点检测更为全局化且准确的变点检测去找到所有情感态度的突变点。

作者使用的Pruned Exact Linear Time (PELT)算法可以在线性时间内准确找到所有显著的突变点并且不需要预设突变点数。

在这种方向的帮助下,研究者成功归纳出某些口罩使用政策的推行或特定事件对于口罩使用态度的影响。

除了分析用户在Twitter上对于COVID-19期间口罩使用的看法,这项论文的成果还有很多深远的意义。

例如,论文总结出了人们关于口罩使用的大体谈论内容和高频词汇,这将更利于社会对大众的关注点进行判断。

假如利用到商业,可以更精确的预测用户需求,“私人订制”推送服务,给企业带来利润,也让消费者免受无用广告的干扰。

只是看看论文的一些感想,还有总结他人的看法,当作一个笔记。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值