- 博客(4)
- 收藏
- 关注
原创 【机器学习】自然语言处理中的关键技术
目录分词规则分词统计分析深度学习分词混合分词词性标注的定义命名实体识别分词中文分词(Chinese Word Segmentation):指的是将一个汉字序列切分成一个单独的词。分词就是将连续的字序列按照一定的规范重新组合成词序列的过程。例如:一九九八年/中国/实现/进出口/总值/达/一千零九十八点二亿/美元规则分词规则分词:一种机械分词方法,主要是通过维护词典,在切分语句时,将语句中的每个字符串与词表中的词进行逐一匹配,找到则切分,否则不予切分。按照匹配切分的方式,主要有:(1)正向最大匹配法
2020-11-02 20:29:50 1468
原创 【机器学习】自然语言处理基础知识
目录参考语言模型神经网络语言模型N - gram语言模型NN语言模型与统计语言模型的关系文本向量化word2vec - CBOW模型word2vec - Skip-gram模型doc2vec - DM模型doc2vec - DBOW模型参考华为云学院https://www.cnblogs.com/pinard/p/7160330.html语言模型语言模型是根据语言客观事实而进行的语言抽象建模,是一种对应关系,假设有以下这类问题:(1)机器翻译(I have a dream):P(我有个梦想)&g
2020-11-02 11:20:37 490
原创 【机器学习】自然语言处理简介
目录什么是自然语言处理自然语言处理的基本方法自然语言处理的三个层面自然语言处理的难点什么是自然语言处理利用计算机为工具对人类特有的书面形式和口头形式的自然语言的信息,进行各种类型处理和加工的技术。——冯志伟自然语言处理可以定义为研究在人与人交际中以及在人与计算机交际中的语言问题的一门学科。自然语言处理要研制表示语言能力和语言应用的模型,建立计算框架来实现这样的语言模型,提出相应的方法来不断完善这样的语言模型,根据这样的语言模型设计各种实用系统,并探讨这些实用系统的评测技术。——Bill Manaris
2020-11-02 08:48:47 2560
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人