目录 自然语言处理概要 分词与词性标注 N-Gram 分词 分词及词性标注的难点 法则式分词法 全切分 FMM和BMM Bi-direction MM 优缺点 统计式分词法 N-Gram概率模型 HMM概率模型 词性标注(Part-of-Speech Tagging) HMM 文本挖掘概要 信息检索(Information Retrieval) 全文扫描 关键词 逐项反转 签名文件 向量空间模型 关键词提取 文本非结构数据转结构 词袋模型 无监督词嵌入模型-Glove PCA 矩阵分解 有监督的词嵌入模型—Word2Vec Skip-Gram CBOW 自然语言处理概要 分词与词性标注 N-Gram 分词 <