![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
自然语言处理
文章平均质量分 93
No Null
这个作者很懒,什么都没留下…
展开
-
自然语言处理之词典分词
目录2. 词典分词2.1 什么是词2.2 词典2.3 切分算法2.4 字典树2.5 基于字典树的其它算法2.6 HanLP的词典分词实现2. 词典分词中文分词:指的是将一段文本拆分为一系列单词的过程,这些单词顺序拼接后等于原文本。中文分词算法大致分为基于词典规则与基于机器学习这两大派。2.1 什么是词在基于词典的中文分词中,词的定义要现实得多:词典中的字符串就是词。词的性质–齐夫定律:一个单词的词频与它的词频排名成反比。2.2 词典互联网词库(SogouW,原创 2021-08-28 10:20:20 · 2069 阅读 · 0 评论 -
自然语言处理之新手上路
1. 新手上路自然语言处理(Natural Language Processing,NLP)是一门融合了计算机科学、人工智能及语言学的交叉学科,它们的关系如下图所示。这门学科研究的是如何通过机器学习等技术,让计算机学会处理人类语言,乃至实现终极目标–理解人类语言或人工智能。美国计算机科学家Bill Manaris在《计算机进展》( Advances in Computers)第47卷的《从人机交互的角度看自然语言处理》一文中曾经给自然语言处理提出了如下的定义:“自然语言处理可以定义为研究在人与人交际原创 2021-08-26 16:31:26 · 157 阅读 · 0 评论