【自然语言处理】专业术语汇总(持续更新...)

基础NLP 的名词:

分词(Segment)
词性标注(Label)
命名实体识别(Named Entity Recognition)
句法分析(Syntax Parsing)
情感识别(Emotion Recognition)
纠错(Correction)
问答系统(QA System)

正则化(normalization)
标准化(scale)
标记化(tokenization)
标记(token)
语料库 corpus

未登录词:由于中文中存在很多没有被收录在分词词表中但必须切分出来的词,包括各类专有名词(人名、地名、机构名等)、新词等等,从而产生未登录词的难题,不过目前已经广泛使用命名实体识别(NER)来识别出名、地名、机构名等专有名词
softmax:是分类器也可以做归一化

多模态系列文章:

VQA:视觉问答
annotation:标注(应该是指标注数据集吧)
motivation:动机
cross attention:交叉注意力机制
meme:主要就是图片+文字的形式,玩梗,也有别的形式(动图、纯图片、短视频等等)。
OCR:文字识别
multi-modal:多模态
SOTA:state of the art 技术发展最新水平
MLP:多层感知机
spectral approaches:谱方法
non-spectral approaches:非谱方法(基于空间的方法)
backbone:主干网络,主干网络大多时候指的是提取特征的网络,其作用就是提取图片中的信息,共后面的网络使用。这些网络经常使用的是resnet VGG等,而不是我们自己设计的网络,因为这些网络已经证明了在分类等问题上的特征提取能力是很强的。在用这些网络作为backbone的时候,都是直接加载官方已经训练好的模型参数,后面接着我们自己的网络。让网络的这两个部分同时进行训练,因为加载的backbone模型已经具有提取特征的能力了,在我们的训练过程中,会对他进行微调,使得其更适合于我们自己的任务。
2.head:head是获取网络输出内容的网络,利用之前提取的特征,head利用这些特征,做出预测。
3.neck:是放在backbone和head之间的,是为了更好的利用backbone提取的特征
4.bottleneck:瓶颈的意思,通常指的是网网络输入的数据维度和输出的维度不同,输出的维度比输入的小了许多,就像脖子一样,变细了。经常设置的参数 bottle_num=256,指的是网络输出的数据的维度是256 ,可是输入进来的可能是1024维度的。
5.GAP:在设计的网络中经常能够看到gap这个层,我之前不知道是干啥的,后了解了,就是Global Average Pool全局平均池化,就是将某个通道的特征取平均值,经常使用AdaptativeAvgpoold(1),在pytorch中,这个代表自适应性全局平均池化,说人话就是将某个通道的特征取平均值。

专业术语

BERT 及它一系列文章:

seq2seq :输出长度不确定的模型(如:RNN)
transformer:使用了很多 self-attention 的 seq2seq 模型
BERT:unsupervised 训练的 transformer

GNN 系列文章:

GCN:使用拉普拉斯算子进行 GNN 权重加载
GAT:使用self-attention进行 GNN 权重加载

基础数学的一些名词:

inner product:内积(就是点积)
dot product:点积
dot:点积
dim(dimension):维度
matrix:矩阵
element:元素

  • 5
    点赞
  • 15
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
你好!自然语言处理(Natural Language Processing,简称NLP)是人工智能(AI)领域的一个重要分支,它涉及计算机与人类自然语言之间的交互和理解。NLP可以帮助计算机理解、解析和生成人类语言,从而实现许多有趣和实用的应用,例如文本分类、机器翻译、情感分析和智能问答等。 对于入门NLP,你可以从以下几个方面开始学习: 1. 了解基本概念:学习自然语言处理领域的基本概念和术语,如词向量、语料库、语言模型等。 2. 学习常用工具和库:掌握一些常用的NLP工具和库,如NLTK、spaCy和Stanford CoreNLP等,它们提供了丰富的功能和算法来处理自然语言数据。 3. 文本预处理:学习如何对原始文本进行预处理,包括分词、词性标注、句法分析等,以便后续的特征提取和模型训练。 4. 特征提取:了解不同的特征提取方法,如词袋模型(Bag of Words)、TF-IDF、Word2Vec等,它们可以将文本数据转化为机器学习算法可以处理的向量形式。 5. 模型选择与训练:熟悉一些常见的NLP模型,如朴素贝叶斯、支持向量机(SVM)、递归神经网络(RNN)和变换器(Transformer),并学会如何选择合适的模型并进行训练。 6. 应用实践:尝试应用NLP技术解决实际问题,如文本分类、情感分析、命名实体识别等,通过实践加深对NLP的理解和掌握。 希望这些信息能帮助你入门自然语言处理!如果你还有其他问题,可以继续问我。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

浪里摸鱼

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值