自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(3)
  • 收藏
  • 关注

原创 2023年春季学期NLP总结作业

在学习自然语言处理这门课程中,我收获了许多知识。首先,通过学习自然语言处理,我更深入地理解了自然语言的结构和语法。通过学习自然语言处理的基本原理和算法,认识到自然语言的复杂性和规律性,从而更好地理解了自然语言的组成和含义。在之前,我只是简单地使用自然语言进行交流,没有深入思考过自然语言的本质和规则。其次,我掌握了一些自然语言处理技术和方法。例如,中文分词、词性标注、命名实体识别、句法分析、语义分析等。这些技术可以应用到文本分类、情感分析、机器翻译、问答系统等多个领域中,为实际应用提供基础和支持。

2023-06-26 17:10:09 39 1

原创 NLP作业02:课程设计报告

数据抽取部分,得到了一个正常短信和垃圾短信的饼状图,可以看见数据集里面,正常短信有720000条,垃圾短信有80000条。正常短信占90%,垃圾短信占10%。数据预处理部分,选取部分样本,进行了去除重复数据,分词,去除停用词等操作。得到了想要的数据结果,为后续的工作做了准备。词云图展示部分,首先对处理好的数据进行统计,得到了每个词出现的次数。接着用WordCloud绘图,进行词云图展示,分别得到了正常短信词云图和垃圾短信词云图。

2023-06-20 16:51:55 86

原创 NLP作业01:请利用HMM实现词性标注

HMM由初始状态概率向量π ,状态转移概率矩阵A和观测概率矩阵B决定,其中 π和 A 决定状态序列,B决定观测序列。

2023-04-19 19:33:01 55 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除