作者:刘小芬,R语言中文社区专栏作者。知乎专栏:https://www.zhihu.com/people/liu-xiao-fen-10/columns
七夕,是中国传统节日中最具浪漫色彩的一个节日,也是传说中牛郎织女鹊桥相会的日子。这一天,对于情侣们来说是美好的一天,而对于“单身汪”们来说就是各种“被撒狗粮”的一天。世间最美好的愿景莫过于“遇一人白首,择一城终老”,七夕将近,用一组数据告诉“单身汪”们什么样的气质在异性眼里最有魅力,什么样的表现在约会中胜率最大。
数据来源:http://www.qingfan.com/project/speed_dating_data_visualization
分析目的:
1. 男性和女性在择偶观上有什么差异;
2. 约会中最受欢迎的男性和女性分别具备什么特质;
3. 有共同兴趣爱好的约会伙伴是否更容易约会成功。
第一步:导入数据
数据理解:
iid:整体实验中参与者的编号
id:参与者在所在实验轮次中的子编号
gender:性别(女 0 男 1)
wave:实验轮次
round:参与者该轮约会对象的总人数
order:该约会对象是参与者当晚约会的第几个异性
partner:参与者约会对象的编号
pid:参与者约会对象在该实验轮次中的编号
match:1 匹配成功(双方都愿意与对方再次约会)0 匹配不成功
samerace:1 双方同种族, 0 双方不同种族
attr:“吸引力”指标的偏好程度分配(6 个指标共 100 分)
sinc:“真诚度”指标的偏好程度分配(6 个指标共 100 分)
intel:“智商”指标的偏好程度分配(6 个指标共 100 分)
fun:“有趣度”指标的偏好程度分配(6 个指标共 100 分)
amb:“进取心”指标的偏好程度分配(6 个指标共 100 分)
shar:“共同爱好”指标的偏好程度分配(6 个指标共 100 分)
第二步:数据处理
这里主要是对缺失数据进行处理,直接就采用了mice包进行缺失值补足。
library(mice)
micedata <- mice(iiddata,method = "rf")
iiddata <- complete(micedata)
第三步:数据分析
3.1 男性和女性在择偶观上有什么差异
首先是参加实验前,对择偶观的看法:
从图中可以看出,参与者在参加实验前,女性最看重的前三项选择是:真诚度、智商、有趣,男性最看重的前三项是:吸引力、智商、有趣。不管是女性还是男性都同时看重智商和有趣。
参加实验后,对择偶观的看法:
从图中可以看出,参与者在参加实验后,女性最看重的前三项选择是:吸引力、智商、有趣,男性最看重的前三项是:吸引力、有趣、智商。
具体数值比较:
共有274名女性、277名男性参加了实验,实验前后对各择偶观点的偏好程度发生了改变,最明显的变化就是更看重吸引力。
因此,对于男性来说看重异性的吸引力、有趣和智商,而女性在约会前看重的是真诚、智商和有趣,约会后看重的是吸引力、有趣和智商。不管怎样,一个有趣又有智商的人总是讨人喜欢的。
3.2 约会中最受欢迎的男性和女性分别具备什么特质
首先需要分析那些人更受欢迎,也就是约会者对参与者的喜爱程度最高,喜爱程度为10的对象:
共有182位约会者对参与者非常满意。
3.2.1约会中最受欢迎的男性具备什么特质:
最受欢迎的男性数据:
共有74位男性参与者比较受异性约会者的喜爱。
3.2.1.1分析受欢迎男性的职业:
职位前三项是 Lawyer、Investment Banking、Teacher/Professor。
3.2.1.1分析受欢迎男性的专业:
专业的前三项是:MBA、Law、Business。
3.2.1.3最受欢男性的爱好:
筛选哪位男性是受约会者喜爱的,也就是有多名约会者选择他,看看他的爱好是什么:
最受欢迎的男性是ID为107和125的男性。
共同爱好是:喜欢外出饮食、美术馆、艺术、俱乐部、阅读、戏剧、电影、音乐会、瑜伽。
出乎意料的是,居然是对瑜伽很感兴趣....
3.2.2约会中最受欢迎的女性具备什么特质:
最受欢迎的女性数据:
共有108位女性参与者比较受异性约会者的喜爱。
3.2.1.1分析受欢迎女性的职业:
职位前三项是 Lawyer、medicine、International Development。
3.2.1.1分析受欢迎女性的专业:
专业的前三项是:Law、Social Work、medicine。
3.2.1.3最受欢女性的爱好:
筛选哪位女性是受约会者喜爱的,也就是有多名约会者选择她:
最受欢迎的女性是ID为470的女性。
爱好是:喜欢外出饮食、美术馆、艺术、阅读、戏剧、电影、购物。
更意外是,居然是对瑜伽没兴趣....
所以,约会中最受欢迎的男性和女性职业是Lawyer,专业是Law,爱好是外出饮食、美术馆、艺术、阅读、戏剧、电影,也就是专业性强,且属于爱好广泛的人。
3.3 有共同兴趣爱好的约会伙伴是否更容易约会成功
成功配对中有共同爱好的数据:
共有1380对情侣配对成功。
筛选出关于共同爱好指标的评价数据:
其中,share_o是约会对象对参与者“共同爱好”指标的评价(1-10),shar是参与者对约会对象“共同爱好”指标的评价(1-10),接下来筛选出这两个分值在8、9、10中的数据:
共有224对情侣觉得他们有着共同的爱好,计算占比16.23%,有着共同爱好的男女在成功配对中占比只有16.23%,也就是说有着共同爱好的人并不是更容易配对成功。
粗略分析了一下,总体来说,有趣有料的人更受欢迎~
公众号后台回复关键字即可学习
回复 R R语言快速入门免费视频
回复 统计 统计方法及其在R中的实现
回复 用户画像 民生银行客户画像搭建与应用
回复 大数据 大数据系列免费视频教程
回复 可视化 利用R语言做数据可视化
回复 数据挖掘 数据挖掘算法原理解释与应用
回复 机器学习 R&Python机器学习入门