- 博客(7)
- 问答 (1)
- 收藏
- 关注
原创 NLP 文本表示:从one-hot到word2vec
文本表示:文本表示的意思是把字词处理成向量或矩阵,以便计算机能进行处理。文本表示按照细粒度划分字级别、词语级别、句子级别的文本表示。文本表示可分为离散表示(离散、高维、稀疏):代表就是词袋模型,one-hot(也叫独热编码)、TF-IDF、n-gram都可以看作是词袋模型。分布式表示(连续、低维、稠密): 词嵌入(word embedding),经典模型是word2vec、Glove...
2019-09-23 13:08:18 1195
空空如也
sqlServer2008求助。。
2017-01-08
TA创建的收藏夹 TA关注的收藏夹
TA关注的人