现在有两个房子的数据
房子1:[100,5]
100代表的是房子1的面积(平方米),5代表的是房子1的房间数(个数)
房子2:[200,2]
200代表的是房子2的价格(万),2代表的是房子的高度(高度)
现在要想用一个统一的尺度来归纳房子1和房子2,又不能缺失两个房子的基本属性,就可以用One-Hot编码(独热编码)
因为两个房子没有公共属性,所以我们就用总长度为4(房子1的两个属性➕房子2的两个属性)的向量来表示:
房子1:[0,0,100,5]
前两个属性都为0,因为房子1没有价格和高度的信息
房子2:[200,2,0,0]
后两个属性都为0,因为房子2没有面积和房间数的信息
这样就用One-Hot(独热编码)把两个房子的属性归纳到一个统一的度量标准中。