问:
用向量方式从智力层面描述李华。已知:李华的语文成绩88,数学成绩3,英语成绩18,身高149,体重35公斤,父亲是大学教授,母亲是音乐家,立定跳远2.1米,50米自由泳个人记录93秒。
答:
根据已有信息(特征),李华的完整向量表示为:[88, 3, 18, 149, 35, 大学教授, 音乐家, 2.1, 93]。
根据先验知识,身高、体重、立定跳远、游泳成绩、家世和智力无明显关系,摒弃掉,仅保留[语文成绩,数学成绩,英语成绩] 三个维度的特征。
得李华智力向量的: [88, 3, 18]。
这就是 Embedding 方法。
这个例子不仅揭示了 Embedding 技术压缩数据的本质(9维数据压缩到3维),还体现出了 Embedding 的一个特点:丢失信息。