2023年春季学期NLP总结作业

本篇博客作者总结了2023年春季学期的自然语言处理课程,包括命名实体识别、词性标注、实体关系抽取等核心概念,探讨了RNN在序列数据处理中的应用,强调了seq2seq模型在聊天机器人中的作用。同时,作者反思了学习过程中的不足,如时间管理,指出课前预习和构建知识体系的重要性。通过量化自我评价,显示了良好的学习成果。暑假计划将重点放在考公准备上,同时提升综合能力。
摘要由CSDN通过智能技术生成

一、我学到的内容

自然语言总体大纲内容:
  命名实体识别是指从文本中识别出人名、地名、组织机构名等具有特定意义的实体;词性标注是指为文本中的每个词汇标注其词性,如名词、动词、形容词等;实体关系抽取和事件抽取指的是从文本中提取出实体之间的关系和事件信息;形式语言与自动机是NLP中的基础概念,用于描述和处理自然语言的结构和规则;句法分析是指分析句子的结构和语法规则;中文分词是将中文文本分割成词语的过程;机器翻译是使用计算机自动将一种语言翻译成另一种语言。
在这里插入图片描述

将大纲细化后得出流程图:

在这里插入图片描述

二、我的收获

  在课程学习中,注意到了许多细节问题,例如进行RNN实验时,需要根据数据的特点选择合适的RNN结构,如果数据是序列数据那么可以考虑使用一对一、一对多、多对一或多对多结构,其中,多对多结构可以使用seq2seq模型,将输入序列编码成一个向量,再将向量解码成输出序列;在进行基于概率上下文无关文法的统计句法分析时需要将输入的句子转换为一个句法树,其中每个节点表示一个短语,每个叶子节点表示一个单词。
  从自然语言的课程学习中,我了解到了自然语言处理中的一些基本概念和技术,如命名实体识别、词性标注、实体关系抽取和事件抽取等,知道了形式语言与自动机在NL

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值