自然语言
weixin_45691110
这个作者很懒,什么都没留下…
展开
-
李宏毅《深度学习人类语言处理》-2 笔记
P2 Speech Recognition(Part 1)语音识别:语音是一个序列向量,长度为T,维度为d文字是一个序列token,长度为N,内容id为它在词表中的序号通常T是要远远大于N的。关于输出把文字想成是一个个的token。这个token可以是发音的基本单位Phoneme:例如WAHN PAHNCH MAEN,这其中每一个符号对应到一种声音。所以需要一个词表L...原创 2020-05-03 19:49:12 · 406 阅读 · 0 评论 -
CS224N(Lecture 10) -2019 斯坦福
Lecture 10(2019 斯坦福)Question Answering问答系统(简称QA),是近几年比较火的NLP应用之一,常见的应用有:问答机器人、智能客服等。本节内容将主要讲解了斯坦福所提出的Stanford Attentive Reader模型,和简要分析一下其他相关模型。一、 是什么推动了问答系统?大量的文本文档集在手机上它的工作原理会更加有效,或者是数字助理设备(Al...原创 2020-03-26 16:17:59 · 123 阅读 · 0 评论 -
CS224N(Lecture2)
Lecture 2Word Vectors and Word Senses本节的主要内容包括:word2vec的优化word2vec的一些表示方法如何评价词向量word2vec的优化1. Review: Main ideal of word2vec遍历整个语料库中的每个单词每个单词用分别用中心词和上下文词两个向量表示更新参数以使目标函数最小化首先,有两个向量矩阵,分别...原创 2020-03-16 14:42:32 · 224 阅读 · 0 评论