NLP到word2vec实战班视频截图3---Word2vec实战和kaggle案例分析

最新推荐文章于 2022-01-17 10:40:12 发布

Walter_Silva

最新推荐文章于 2022-01-17 10:40:12 发布

阅读量471

点赞数

分类专栏： NLP

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Gin077/article/details/84404624

版权

NLP 专栏收录该内容

6 篇文章 1 订阅

订阅专栏

是用全量数据训练还是采用领域内的样本（数量足够大的话），领域内的更有效

语料处理和模型构建

标点去不去掉要看不同场合

针对one-hot的特征，树模型其实不太合适

一句话中每个词都对应一个N维的向量，这句话的向量就是各个词向量的average。但这种方式比较粗暴，结合tfidf借助外部的语料判断哪些词更重要也许效果会好些，对重要的词赋予更重要的权重。

LSTM效果会比SVM好些

比如把电商客户的浏览路径看作是句子分词后的sequence，送入word2vec模型中训练一个300维（一般300维可以用了）的向量，这个效果比协同过滤的召回率高。

一个例子

这个project的地址

https://github.com/manasRK/word2vec-recommender

slides：https://docs.google.com/presentation/d/1D4kdRbpHIZJ6YJc0huCRjiipNImC3rZxKSUdP_uub2U/edit#slide=id.p4

案例中的代码后续补齐

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
NLP到word2vec实战班视频截图3---Word2vec实战和kaggle案例分析

是用全量数据训练还是采用领域内的样本（数量足够大的话），领域内的更有效语料处理和模型构建标点去不去掉要看不同场合针对one-hot的特征，树模型其实不太合适一句话中每个词都对应一个N维的向量，这句话的向量就是各个词向量的average。但这种方式比较粗暴，结合tfidf借助外部的语料判断哪些词更重要也许效果会好些，对重要的词赋予更重要的权重。LSTM效果会比SV...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。