自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(3)
  • 收藏
  • 关注

原创 NLP从零开始------3.文本基础处理之语料库

语料库是为某一个或多个应用而专门收集的、有一定结构的、有代表性的、可以被计算机程序检索的、具有一定规模的语料的集合。其实语料库的本质就是经过科学取样和加工的大规模电子文本库。对于语料库来说有三个显著特征:1.语料库中存放的是真实出现过的语言材料。2. 语料库是以计算机为载体,承载语言知识的基础资源。3.语料库是对真实语料进行加工、分析和处理的资源。任何一个信息处理系统都离不开语料库的支持,在nlp中更是如此。

2024-07-30 22:31:58 448

原创 NLP从零开始------2.基础概念解析

利用计算机对自然语言的形、音、意进行处理。即对字、词、句、篇进行输入、输出、识别、分析、理解、生成等操作和加工过程。nip机制涉及两个流程,自然语言理解和自然语言生成。自然语言理解研究的是计算机如何理解自然语言文本中的信息。自然语言生成研究是计算机如何生成自然语言文本表达给定意图和思想等。

2024-07-29 21:15:33 524

原创 NLP从零开始------1.环境搭建

(交互式代码编译器)jupyter notebook。首先启动相应虚拟环境,然后在此环境下下载相应包。pycharm(本系列采用)推荐conda管理环境与包。

2024-07-29 18:56:10 309

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除