one-hot编码

统计语言模型中常用的词向量模型有:One-hot编码,Word2Vec和GloVe等。
One-Hot编码可用于机器学习,将类变量转换为多维向量的形式.。One-Hot采用N位状态寄存器来对N位状态进行编码,每个状态都是由独立的寄存器表示,在任意时候只有一位寄存器有效。One-Hot 采用二进制编码,寄存器的状态由0或1组成,因为只有一位寄存器有效,所以在任意时候,只有一个寄存器的编码为1, 其余寄存器的编码都为0。举例来说,如果要对[“香蕉”,“苹果”,“芒果”,‘苹果’],进行One-Hot编码,可以使用三个寄存器来保存这三个特征,每个特征只有一-位寄存器值有效,One-Hot编码可表示为[[1,0,0],[0,1,0],[0,0,1],[0,1,0]]。由这个例子可以看出,One-Hot 寄存器的个数与特征数有关,一般情况下,有多少个特征,就需要多少个寄存器。One-Hot的特点是会构成大量的稀疏矩阵,所以在特征值很多的情况下,并不适用这种编码方法,而且单纯的0和1表示状态,并不能体现不同单词之间的隐含关系,编码效果不好。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值