局部表示与分布式表示

1.局部表示

咱们常见的离散型数值,符号等,用的都是局部表示;比如鸢尾花数据集的特征值,类别号;
还有一个常见的局部表示就是one-hot编码,把一些文字性的特征值进行编码。

优点:

①经过one-hot编码后,多种特征进行组合后,是一个稀疏的矩阵,当用于线性模型的计算时效率非常高
②离散的表示方式有很好的解释性,有利于人工归纳和总结特征

缺点:

①经过one-hot编码后,两两特征之间的相关性就是0,无法正确表示出它们之间的相关性
②one-hot向量维度特别大,而且还不能扩展,如果进来一个新的特征值,就得再加一维

2.分布式表示

分布式表示最本质的就是嵌入,将高维数据压缩到低维表示,并且不改变它们之间的基本位置关系,拓扑关系
eg:颜色的数据用RGB三个值来表示,不是使用one-hot对各个颜色值进行编码

优点:

能降低数据存储维度,用低维表示高维,压缩数据

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值