自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(3)
  • 收藏
  • 关注

原创 2023年春季学期NLP总结作业

通过学习自然语言处理,我了解了不同的技术和算法,如分词、词性标注、句法分析等,这些技术和算法可以帮助我更好地处理和利用自然语言文本。通过学习自然语言处理,我更加深入地了解了自然语言的性质和规律,这让我对语言的理解和表达能力有了更深层次的认识。但是,在本学期的学习中,我没有充分准备好所需的数据集和相应的实验环境,导致在实践和实验过程中遇到了一些困难和阻碍。在课程开始之前,我对自己的期待是能够全面了解自然语言处理的基本原理和应用,并能够熟练运用相关的技术和工具进行自然语言文本的处理和分析。

2023-06-25 22:19:02 66

原创 NLP作业02:课程设计报告

词云图是文本结果展示的有利工具,通过词云图的展示可以对短信文本数据分词后的高频词予以视觉上的强调突出效果,从而达到过滤绝大部分的低频词汇文本信息的效果,使得阅读者一眼就可获取到文本的主旨信息。部分短信相似程度极高,可是在某些词语的运用上存在差异。本次课程设计我的内容是基于文本内容的垃圾短信识别,实验的过程主要运用到jieba,pandas,numpy,matplotlib,sklean等库,通过python代码建立模型,区分出文本中的垃圾短信与正常短信,能够准确地识别出垃圾短信,以解决垃圾短信过滤问题。

2023-06-20 16:55:14 195 1

原创 NLP作业01:请利用HMM实现词性标注

定义:指的是一个隐层的马尔可夫链(MC)随机生成不可观测的状态序列,再由状态序列生成可观测的观测序列的过程。隐马尔科夫模型由初始状态概率向量Π 、状态转移矩阵 A和观测概率矩阵B 决定。Π和 A决定状态序列,B决定观测序列。因此,隐马尔科夫模型 可以用三元符号表示,即A,B,Π 称为隐马尔科夫模型的三要素。

2023-04-19 19:16:23 102 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除