AI知识点
文章平均质量分 92
AI完全体
一个突破了心魔,尝试通过自学转行AI的非典型程序员,专栏博客将见证我的完整转行过程和AI成长之路。
展开
-
【AI知识点】共现矩阵(Co-occurrence Matrix)
共现矩阵(Co-occurrence Matrix)是一种在自然语言处理中广泛使用的数学工具,用于表示词语在文本中相互出现的情况。它通常用于分析词语在文本中的共现关系,即哪些词语在同一上下文中经常一起出现。共现矩阵是生成词嵌入(Word Embedding)的一种重要方法,例如在GloVe模型中,它通过捕捉词语的共现信息来学习词语的语义表示。原创 2024-10-02 16:39:03 · 360 阅读 · 0 评论 -
【AI知识点】词嵌入(Word Embedding)
词嵌入(Word Embedding)是自然语言处理(NLP)中的一种技术,用于将词语或短语映射为具有固定维度的实数向量。这些向量(嵌入向量)能够捕捉词语之间的语义相似性,即将语义相近的词映射到向量空间中距离较近的位置,而语义相异的词会被映射到较远的位置。词嵌入是文本表示学习的核心,广泛应用于文本分类、机器翻译、文本生成、问答系统等任务中。原创 2024-10-02 15:54:45 · 662 阅读 · 0 评论 -
【AI知识点】N-gram 模型
N-gram模型 是一种统计语言模型,用于根据前面 (N-1) 个词预测当前词。它广泛应用于自然语言处理(NLP)领域,尤其是在语言建模、机器翻译、拼写纠错、文本生成等任务中。N-gram 模型通过分析词语的共现频率,来建模一段文本中词语的相互关系。原创 2024-10-02 14:00:10 · 380 阅读 · 0 评论 -
【AI知识点】词频-逆文档频率(TF-IDF)
词频-逆文档频率(TF-IDF,Term Frequency-Inverse Document Frequency)是一种用来衡量一个词在某个文档中的重要性,同时结合该词在整个文档集中的出现频率。它的核心思想是:在特定文档中出现频率高且在其他文档中较少出现的词会被赋予更高的权重,而那些在所有文档中普遍出现的词则会被削弱。原创 2024-10-02 13:25:24 · 375 阅读 · 0 评论 -
【AI知识点】余弦相似度(Cosine Similarity)
余弦相似度(Cosine Similarity)是一种用于衡量两个向量在方向上的相似程度的指标。它主要用于文本分析、自然语言处理(NLP)、推荐系统等任务中,能够衡量两个向量之间的相似性,而不受向量的长度(模)影响。原创 2024-10-02 11:50:30 · 407 阅读 · 0 评论 -
【AI知识点】欧几里得距离(Euclidean Distance)
欧几里得距离(Euclidean Distance)是一种常用的几何距离度量方法,用来计算两个点之间的直线距离。在二维或更高维空间中,欧几里得距离可以看作是“最短路径”的概念。它在机器学习、图像处理、模式识别、聚类分析等领域有广泛的应用。原创 2024-10-02 11:30:15 · 279 阅读 · 0 评论 -
【AI知识点】嵌入向量(Embedding Vector)
嵌入向量(Embedding Vector)是通过嵌入函数(Embedding Function)将复杂、高维或稀疏数据(如文本、图像、分类特征等)映射到低维、稠密空间中表示的向量。这种向量表示保留了原始数据的语义或结构信息,在机器学习和深度学习中广泛用于处理文本、图像、用户行为等任务。嵌入向量是许多模型的核心组成部分,它能以低维形式有效表达高维数据,并用于计算相似性、分类等任务。原创 2024-10-01 18:57:02 · 807 阅读 · 0 评论 -
【AI知识点】词袋模型(Bag-of-Words,BOW)
词袋模型(Bag-of-Words,简称BOW)是一种用于文本表示的简单且常用的方法,尤其在自然语言处理(NLP)和信息检索领域中广泛应用。词袋模型的核心思想是将文本表示为一个词频统计的集合,而不考虑词的顺序和语法结构。每个词在文本中出现的频率被用来表示文本的特征。原创 2024-10-01 18:46:58 · 716 阅读 · 0 评论 -
【AI知识点】向量空间(vector space)
向量空间(vector space),有时称为线性空间,是数学中线性代数的一部分,它描述了向量的集合以及这些向量可以进行的操作。向量空间是计算机科学、机器学习和自然语言处理(NLP)等领域的基础概念,尤其在表示数据的特征时,向量空间模型得到了广泛应用。原创 2024-10-01 18:20:59 · 466 阅读 · 0 评论 -
【AI知识点】点积相似性(dot-product similarity)
点积相似性(dot-product similarity)是一种通过计算两个向量的点积(dot product)来衡量它们之间相似性的方法。点积相似性在机器学习和深度学习中广泛应用,尤其在嵌入向量空间中,用于衡量两个向量之间的相似度。原创 2024-10-01 17:49:17 · 786 阅读 · 0 评论 -
【AI知识点】度量学习(Metric Learning)
度量学习(Metric Learning)是一种机器学习方法原创 2024-10-01 17:22:10 · 517 阅读 · 0 评论 -
【AI知识点】负对数似然损失函数(Negative Log-Likelihood Loss,NLL)
介绍:负对数似然损失函数(Negative Log-Likelihood Loss,NLL)原创 2024-10-01 15:59:32 · 599 阅读 · 0 评论