在各个行业,尤其是电商行业当中,经常需要做各个人群之间的相似度分析,以便于找到品牌的核心用户,在拉新过程中,我们也需要用现有数据来挖掘潜在客户。下面为大家提供一个做人群相似度的思路。
![f56f6cb28efdf91f249f8497eaae41de.png](https://i-blog.csdnimg.cn/blog_migrate/5056acee21ac9ebab9e3454b9ceee434.jpeg)
1、数据准备
需要准备的数据包括每一类数据及其特征,
实际数据如下:
![8716f46621f3f55a6c4e92230927dcdf.png](https://i-blog.csdnimg.cn/blog_migrate/6cc80cb341351d9d9f2663adeb8a0f2b.jpeg)
2、计算人群距离
这里我们评价一个类别是否和其它类别相似,可是用各个类别的距离来衡量,这里需要用到一个包:
from scipy.spatial import distance
这个包可以计算各个人群之间的距离。
file = '