NLP自然语言处理
文章平均质量分 83
小叶柏杉
一个努力保住头发的程序猿。
展开
-
马尔可夫过程 与 隐马尔科夫模型
为什么是马尔可夫过程?马尔科夫过程(Markov process)是一类随机过程。在已知目前状态(现在)的条件下,它未来的演变(将来)不依赖于它以往的演变(过去)。主要研究一个系统的状况及其转移的理论。它是通过对不同状态的初始概率以及状态之间的转移概率的研究,来确定状态的变化趋势,从而达到对预测未来的目的。概念实际应用场景液体中的微粒子运动传染病的传染人数车站的候车人数两个基本特性1. 无后效性是指如果在某个阶段上过程的状态已知,则从此阶段以后过程的发展变化仅与此阶段的状态有关,而原创 2022-03-08 00:39:43 · 2947 阅读 · 0 评论 -
贝叶斯与朴素贝叶斯
贝叶斯贝叶斯分类算法是统计学的一种分类方法, 它是一类利用概率统计知识进行分类的算法。贝叶斯定理由英国数学家贝叶斯 ( Thomas Bayes 1702-1761 ) 发展,用来描述两个条件概率之间的关系,比如 P(A|B) 和 P(B|A)。按照乘法法则,可以立刻导出:P(A∩B) = P(A)*P(B|A)=P(B)*P(A|B)。如上公式也可变形为:P(A|B)=P(B|A)*P(A)/P(B)贝叶斯公式公式的延伸:概率是反映随机事件出现的可能性大小的量度,而条件概率则是给定某事原创 2022-03-07 23:13:06 · 4748 阅读 · 0 评论 -
NLP 命名实体识别
什么是命名实体识别?**命名实体识别(Named Entity Recognition,简称NER),又称作“专名识别”,**是指识别文本中具有特定意义的实体,主要包括人名、地名、机构名、专有名词等。命名实体识别是信息提取、问答系统、句法分析、机器翻译、面向Semantic Web的元数据标注等应用领域的重要基础工具,在自然语言处理技术走向实用化的过程中占有重要地位。一般来说,命名实体识别的任务就是识别出待处理文本中三大类(实体类、时间类和数字类)、七小类(人名、机构名、地名、时间、日期、货币和百分比原创 2022-03-07 00:09:05 · 3174 阅读 · 0 评论 -
NLP(自然语言处理)学习研究:分词 Tokenization
什么是分词?分词是 自然语言理解 – NLP 的重要步骤。分词就是将句子、段落、文章这种长文本,分解为以字词为单位的数据结构,方便后续的处理分析工作。“我爱自然语言处理” 分词:我 \ 爱 \ 自然 \ 语言 \ 处理我 \ 爱 \ 自然语言\ 处理我 \ 爱 \ 自然语言处理为什么要分词?1.将复杂问题转化为数学问题机器学习之所以看上去可以解决很多复杂的问题,是因为它把这些问题都转化为了数学问题。而 NLP 也是相同的思路,文本都是一些“非结构化数据”,我们需要先将这些数据转化为“原创 2021-05-05 23:58:24 · 1223 阅读 · 0 评论 -
NLP(自然语言处理)学习研究:什么是NLP?
NLP自然语言处理初步的认识原创 2021-05-05 23:05:35 · 3715 阅读 · 0 评论