NLP
文章平均质量分 93
leeyns
一个普通人。
展开
-
BERT论文总结
主要介绍了BERT文章的预训练部分以及数据的生成部分。原创 2022-08-23 22:04:26 · 1026 阅读 · 0 评论 -
Simple Image Caption Tutorial
Simple Image Caption TutorialData set: Flickr8k-Images-CaptionsVideo: Pytorch Image Captioning TutorialGitHub: Image CaptioningIn this tutorial, inception v3 and LSTM are used to build the model.Build VocabularyBuild your own vocabularyConvert text原创 2021-10-25 19:01:54 · 331 阅读 · 0 评论 -
Word2vec
Word2vec是一个学习单词向量的框架IDEA:我们有大量的文本 (corpus means ‘body’ in Latin. 复数为corpora)固定词汇表中的每个单词都由一个向量表示文本中的每个位置 t,其中有一个中心词 c 和上下文(“外部”)单词 o使用 c和 o的词向量的相似性来计算给定 c的 o的概率不断调整词向量来最大化这个概率目标函数L(θ)=∏t=1T∏−m≤j≤mj≠0P(wt+j∣wt;θ)L(\theta)=\prod_{t=1}^{T} \prod_{-原创 2021-08-31 14:42:34 · 70 阅读 · 0 评论