自然语言处理之输入层(一)
文章目录前言一、文本预处理1.预处理步骤二、词嵌入(Word Embedding)1.one hot encoding2.word embedding前言NLP中的一些基本步骤和方法简介一、文本预处理1.预处理步骤(1)Tokenization注意:在做tokenization时,还需要考虑:upper case to lower case?但是 有些大写字母有特殊含义比如:Apple和apple,前者表示苹果公司,后者表示苹果;remove stop words,去除停留词,比如.
复制链接