进击的阿刚#-CSDN博客

原创词嵌入（word2vec）

在自然语言系统中，词被看作最为基本的单元，如何将词进行向量化表示是一个很基本的问题，词嵌入（word embedding）就是把词映射为低维实数域向量的技术。提示：以下是本篇文章正文内容，下面案例可供参考。

2024-04-20 10:39:51 803

原创提升方法AdaBoost算法

提升方法是一种常用的统计学习方法，应用广泛且有效。在分类问题中，通过改变训练样本的权重，学习多个分类器，并将这些分类器线性组合，提高分类的性能。

2024-04-14 22:31:51 1130 1

文章目录前言一、SVM要解决的问题是什么？二、线性支持向量机与硬间隔最大化三、学习的对偶算法对偶问题的转化对偶问题的求解四、线性支持向量机与软间隔最大化五、非线性支持向量机与核函数六、SMO算法（序列最小最优化算法）六、代码实现前言支持向量机是一种二分类模型。他的基本模型是定义在特征空间上的间隔最大的线性分类器，间隔最大使它区别于感知机。一、SVM要解决的问题是什么？对于上图中这样一个二分类线性可分问题，期望找到一个分类超平面将正负类分开，SVM就是一个用来寻找这样的分类超平面的算法。定义

2024-04-02 21:31:11 633 1

原创最大熵模型

文章目录前言一、最大熵模型是什么？二、极大似然估计三、模型学习的最优化算法四、代码实现前言最大熵模型是由最大熵原理推导实现。最大熵原理是概率模型学习的一个准则，该原理认为在已知约束条件下，且没有其他的先验知识来限制模型时，选择具有最大熵的模型，可以保证不会引入偏见。一、最大熵模型是什么？最大熵原理应用到分类得到最大熵模型。给定训练集T=(x1,y1),(x2,y2),...,(xN,yN)T={(x_1,y_1),(x_2,y_2),...,(x_N,y_N)}T=(x1,y1),(x2

2024-03-23 18:40:49 1053