NLP笔记

最新推荐文章于 2024-06-23 10:28:16 发布

hectorhan

最新推荐文章于 2024-06-23 10:28:16 发布

阅读量204

点赞数

分类专栏： AI 文章标签： NLP

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/hectorhan/article/details/100629584

版权

AI 专栏收录该内容

0 篇文章 0 订阅

订阅专栏

word Embedding

cs224n课程很不错，强烈推荐
word2vec因为最后一层是softmax，所以向量本身其实意义不大，是向量间的相对距离编码了信息。如，gensim.most_similar实现其实考虑的是夹角。

>>> un = False
>>> v = model.word_vec("king", use_norm=un) + model.word_vec("woman", use_norm=un) - model.word_vec("man", use_norm=un)
>>> un = True
>>> v2 = model.word_vec("king", use_norm=un) + model.word_vec("woman", use_norm=un) - model.word_vec("man", use_norm=un)
>>> model.most_similar(positive=[v], topn=6)
[('king', 0.8449392318725586), ('queen', 0.7300517559051514), ('monarch', 0.6454660892486572), ('princess', 0.6156251430511475), ('crown_prince', 0.5818676948547363), ('prince', 0.5777117609977722)]
>>> model.most_similar(positive=[v2], topn=6)
[('king', 0.7992597222328186), ('queen', 0.7118192911148071), ('monarch', 0.6189674139022827), ('princess', 0.5902431011199951), ('crown_prince', 0.5499460697174072), ('prince', 0.5377321243286133)]
>>> model.most_similar(positive=["king", "woman"], negative=["man"], topn=6)
[('queen', 0.7118192911148071), ('monarch', 0.6189674139022827), ('princess', 0.5902431011199951), ('crown_prince', 0.5499460697174072), ('prince', 0.5377321243286133), ('kings', 0.5236844420433044)]

如何从字向量得到句向量呢，有两篇相似的实现A Simple but Tough-to-Beat Baseline for Sentence Embeddings和Unsupervised RandomWalk Sentence Embeddings: A Strong but Simple Baseline。对字向量进行加权平均，然后再投影到去掉最大主成分的子空间中去。第二篇文章说他们的效果要好一些。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

hectorhan CSDN认证博客专家 CSDN认证企业博客

码龄7年

3: 原创

63万+: 周排名

200万+: 总排名

1845: 访问

: 等级

60: 积分

1: 粉丝

0: 获赞

2: 评论

1: 收藏

私信

关注

热门文章

分类专栏

最新评论

Effective Modern C++笔记
CSDN-Ada助手: 恭喜您写了第6篇博客！标题为“Effective Modern C++笔记”真是令人兴奋。通过分享您的学习笔记，您不仅帮助了自己巩固知识，也为其他读者提供了宝贵的学习资源。下一步，或许您可以考虑深入探讨一些常见的陷阱和解决方案，或者分享一些实际应用中的经验教训。谦虚地说，正如您所提到的"Effective"，这样的主题将为读者提供实用的指导，帮助他们更好地使用现代C++。期待您未来更多的创作！
NLP笔记
CSDN-Ada助手: 非常感谢CSDN博主分享的NLP笔记，对于想要了解自然语言处理的读者来说，这篇博客非常有价值。我觉得下一篇可以写一篇关于情感分析的技术博文，介绍一些情感分析的模型和应用场景，对于想要在NLP领域深入研究的读者来说会非常有帮助。相信会有更多读者期待你的下一篇文章。加油！为了方便博主创作，提高生产力，CSDN上线了AI写作助手功能，就在创作编辑器右侧哦～（https://mp.csdn.net/edit?utm_source=blog_comment_recall ）诚邀您来加入测评，到此（https://activity.csdn.net/creatActivity?id=10450&utm_source=blog_comment_recall）发布测评文章即可获得「话题勋章」，同时还有机会拿定制奖牌。

大家在看

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。