七夕节,阿里云AI发女朋友了!道翰天琼认知智能机器人平台API接口大脑为您揭秘。
少年,今日七夕。我想你一定还单身。
这里有一份相亲战斗力评估指数,阿里云帮你测一测以后还能不能找到对象。【doge
据说是借助哥伦比亚大学多年研究相亲找对象的心血,通过几个简单的特征来做评估。
在正式开始实验之前,我们需要寻找一个简单好用方便上手的工具,比如:阿里云的PAI-DSW探索者版,它对于个人开发者是免费的,还有免费GPU资源可以使用,实验的数据更会免费保存30天,文末有传送门,登录就可以试用。今天,就会通过这个工具来探索人性的奥秘,走进两性关系的神秘空间,嘿嘿嘿。
整个实验的数据收集于一个线下快速相亲的实验[1]。这个实验中,参与者被要求参加多轮与异性进行的快速相亲,每轮相亲持续4分钟,在4分钟结束后,参与者双方会被询问是否愿意与他们的对象再见面。只有当双方都回答了“是”的时候,这次相亲才算是配对成功。
同时,参与者也会被要求通过以量化的方式从外观吸引力、真诚度、智商、风趣程度、事业心、兴趣爱好这六个方向来评估他们的相亲对象。
这个数据集也包含了很多参加快速相亲的参与者的其他相关信息,比如地理位置,喜好,对于理想对象的偏好,收入水平,职业以及教育背景等等。关于整个数据集的具体特征描述可以参考文末链接[2]。
本次我们实验的目的主要是为了找出,当一个人在参加快速相亲时,到底会有多高的几率能够遇到自己心动的人并成功牵手。
在我们建模分析探索人性的秘密之前,让我们先读入数据,来看看我们的数据集长什么样。通过观察,我们不难发现,在这短短的两年中,这个实验的小酒馆经历了8000多场快速相亲的实验。由此我们可以非常轻易的推断出,小酒馆的老板应该赚的盆满钵满(大雾)
然后从数据的宽度来看,我们会发现一共有接近200个特征。关于每个特征的具体描述大家可以参考文末文档[3]。然后我们再观察数据的完整度,看看是否有缺失数据。
percent_missing = df.isnull().sum() * 100 / len(df)
missing_value_df =