案例来源:@将门创投
案例地址:https://mp.weixin.qq.com/s/vhOvZyL8ihacFTCfqs8LVg
1. 目标:对恋人间的亲密关系做量化,并找出影响亲密关系的关键因素
2. 数据来源:利用happy couple,恋人可以在上面回答一些与彼此相关的问题。收集到两大类数据:
1)回答的结果相同,那么定义为“相似”
2)关于对方的问题,如果回答正确,定义为“了解”
通过这两个可量化的数据,衡量情侣间关系的紧密程度。
3. 特征工程:
1)从性、情感、信息、娱乐、责任、交流六个方面进行衡量
2)特征间的相关性
4. 分类器:随进森林
5. 结论:计算特征重要性,其中最重要的是年龄、关系长久和关系的状态,距离会有负面影响