- 博客(2)
- 收藏
- 关注
原创 第二章 Python NLP实战-核心技术与算法----中文分词技术
文章目录前言一、中文分词的痛点1. 中文的歧义性2. 识别未登录词二、基于规则的分词算法1 切分方式1.1 正向匹配法1.2 逆向匹配法1.3 双向匹配法2 词典机制三、基于统计的分词算法四、基于语义理解的分词算法总结参考文献:系列文章目录 前言 自然语言中每句话都由若干个词语组成,相较于英文而言,中文的分词显然难上许多。中文的词语之间没有像英文的空格一样的标记符来区分词语,此外,中文词语的开放性也使得中文分词很难有一个统一的标准,如何提高分词的正确率,已成为当下研究的一个焦点。 这篇博客将会介绍迄今为止
2021-01-05 11:22:13 731
原创 第一章 Python NLP实战-核心技术与算法----NLP基础
文章目录前言一、NLP是什么?1. NLP的概念2. NLP的研究任务二、NLP的发展三、NLP知识组织结构1. 基本术语2. 知识结构四、NLP语料库总结系列文章目录 前言 随着人工智能的不断发展,NLP这门技术也越来越重要,很多人都开启了NLP的学习,本文就介绍了NLP的基础内容。 以下是本篇文章正文内容。 一、NLP是什么? 1. NLP的概念 NLP(Natural Language Processing,自然语言处理)是计算机科学领域及人工智能领域的一个重要研究方向,它研究用计算机来处理、理
2020-12-31 16:06:53 783
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人