![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
NLP
codestorm04
这个作者很懒,什么都没留下…
展开
-
word2vec 中的数学原理详解_codestorm_新浪博客
word2vec 是 Google 于 2013 年开源推出的一个用于获取 word vector 的工具包,它简单、高效,因此引起了很多人的关注。由于 word2vec 的作者 Tomas Mikolov 在两篇相关的论文 [3,4] 中并没有谈及太多算法细节,因而在一定程度上增加了这个工具包的神秘感。相关链接(一)目录和前言(二)预备知识(三)背景知识(四)基于...转载 2018-01-04 13:50:51 · 84 阅读 · 0 评论 -
NDCG、MAP、MRR_codestorm_新浪博客
转自:http://www.cnblogs.com/eyeszjwang/articles/2368087.htmlLearning to Rank for IR的评价指标—MAP,NDCG,MRRMAP(Mean Average Precision):单个主题的平均准确率是每篇相关文档检索出后的准确率的平均值。主集合的平均准确率(MAP)是每个主题的平均准确率的平均值。MAP 是反...转载 2014-05-06 10:29:38 · 122 阅读 · 0 评论 -
TF-IDF与余弦相似性的应用(一):自动提取关键词_codestorm_新浪博客
转自:http://www.ruanyifeng.com/blog/2013/03/tf-idf.html这个标题看上去好像很复杂,其实我要谈的是一个很简单的问题。有一篇很长的文章,我要用计算机提取它的关键词(Automatic Keyphrase extraction),完全不加以人工干预,请问怎样才能正确做到?这个问题涉及到数据挖掘、文本处理、信息检索等很多计算机前沿领域...转载 2014-04-23 20:41:17 · 81 阅读 · 0 评论 -
RNN+Attention+Transformer+Bert
学习资料整理,关于Bert的学习路径需大致按照如下进行理解:1. Vanilla RNN(即最基础的RNN结构) 递归神经网络 训练、推到、实现(网络资料整理) The Unreasonable Effectiveness of Recurrent Neural Networks2. Attention(nlp和图像领域关键模块)注意力机制 ...原创 2019-08-30 15:29:04 · 788 阅读 · 0 评论