- 博客(3)
- 收藏
- 关注
原创 NLP从零开始------3.文本基础处理之语料库
语料库是为某一个或多个应用而专门收集的、有一定结构的、有代表性的、可以被计算机程序检索的、具有一定规模的语料的集合。其实语料库的本质就是经过科学取样和加工的大规模电子文本库。对于语料库来说有三个显著特征:1.语料库中存放的是真实出现过的语言材料。2. 语料库是以计算机为载体,承载语言知识的基础资源。3.语料库是对真实语料进行加工、分析和处理的资源。任何一个信息处理系统都离不开语料库的支持,在nlp中更是如此。
2024-07-30 22:31:58
448
原创 NLP从零开始------2.基础概念解析
利用计算机对自然语言的形、音、意进行处理。即对字、词、句、篇进行输入、输出、识别、分析、理解、生成等操作和加工过程。nip机制涉及两个流程,自然语言理解和自然语言生成。自然语言理解研究的是计算机如何理解自然语言文本中的信息。自然语言生成研究是计算机如何生成自然语言文本表达给定意图和思想等。
2024-07-29 21:15:33
524
原创 NLP从零开始------1.环境搭建
(交互式代码编译器)jupyter notebook。首先启动相应虚拟环境,然后在此环境下下载相应包。pycharm(本系列采用)推荐conda管理环境与包。
2024-07-29 18:56:10
309
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人