NLP自然语言处理

离散表示:one-hot

词典中每个单词都有唯一索引

one-hot表示:语料库中的每一个字表示成词典单词数目的向量

eg:

词典:{"Jone":1,"likes":2,"to":3,"watch":4,"movies":5}

One hot 表示:Jone likes to watch movies

一个词向量表示一个单词
Jone:[1,0,0,0,0]
likes:[0,1,0,0,0]

.......

代码实现:将语料库的词按词频排序,因为词典的词是有个数的,一般选取前多少建立词典,eg前5000个

 

 

词袋bag of words :文档的向量表示可直接将各词的向量和

文章用词袋表示

 

 

余弦相似度 

 

输入:5000维的 one-hot向量

Look-up 查询,将稀疏矩阵成变成稠密向量

输出:5000维的one-hot向量

缺点:没有考虑下文,没有顺序,softmax计算量太大。

 

CBOW:输入的是上下文,预测中心词

SKIP:输入的是 中心词,预测上下文

 

huffman tree:https://blog.csdn.net/qq_29519041/article/details/81428934

 

 

 

 

 

 

 

 

 

DNN=>RNN=>目标检测FAST RCNN=>TRANSFORMER

 

 

 

 LSTM非常慢 

 

BIRD

 

 

 

 

 

注意力机制三部曲:

score=》softmax=》加权求和

 

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值