- 博客(9)
- 收藏
- 关注
原创 词嵌入(word2vec)
在自然语言系统中,词被看作最为基本的单元,如何将词进行向量化表示是一个很基本的问题,词嵌入(word embedding)就是把词映射为低维实数域向量的技术。提示:以下是本篇文章正文内容,下面案例可供参考。
2024-04-20 10:39:51 803
原创 提升方法AdaBoost算法
提升方法是一种常用的统计学习方法,应用广泛且有效。在分类问题中,通过改变训练样本的权重,学习多个分类器,并将这些分类器线性组合,提高分类的性能。
2024-04-14 22:31:51 1130 1
原创 支持向量机
文章目录前言一、SVM要解决的问题是什么?二、线性支持向量机与硬间隔最大化三、学习的对偶算法对偶问题的转化对偶问题的求解四、线性支持向量机与软间隔最大化五、 非线性支持向量机与核函数六、SMO算法(序列最小最优化算法)六、代码实现前言支持向量机是一种二分类模型。他的基本模型是定义在特征空间上的间隔最大的线性分类器,间隔最大使它区别于感知机。一、SVM要解决的问题是什么?对于上图中这样一个二分类线性可分问题,期望找到一个分类超平面将正负类分开,SVM就是一个用来寻找这样的分类超平面的算法。定义
2024-04-02 21:31:11 633 1
原创 最大熵模型
文章目录前言一、最大熵模型是什么?二、极大似然估计三、模型学习的最优化算法四、代码实现前言最大熵模型是由最大熵原理推导实现。最大熵原理是概率模型学习的一个准则,该原理认为在已知约束条件下,且没有其他的先验知识来限制模型时,选择具有最大熵的模型,可以保证不会引入偏见。一、最大熵模型是什么?最大熵原理应用到分类得到最大熵模型。给定训练集T=(x1,y1),(x2,y2),...,(xN,yN)T={(x_1,y_1),(x_2,y_2),...,(x_N,y_N)}T=(x1,y1),(x2
2024-03-23 18:40:49 1053
原创 决策树的算法(ID3,C4.5, CART)
决策树(design tree)是一种基本的分类与回归的方法。在学习过程中,利用训练数据,根据损失函数最小化原则建立决策树模型。预测时,对于新的数据用决策树模型进行分类。决策树学习通常包括三个步骤:特征选择、决策树的生成和决策树的修剪。
2024-03-12 22:12:44 1002 2
原创 朴素贝叶斯法
朴素贝叶斯(naive Bayes)法是基于贝叶斯定理和特征条件独立假设的分布方法。对于给定的训练数据集,首先基于特征条件独立独立假设学习输入输出的联合概率分布。然后基于此模型,对于给定的输入x,利用贝叶斯定理求出后验概率最大的输出。
2024-03-03 15:51:16 807 2
原创 k近邻法的实现
k近邻法是一种基本分类与回归方法。给定一个训练数据集,其中的实例类别已定,对新的输入实例,在训练数据集中找到与该实例最近邻的k个实例,这k个实例的多数属于某个类,就把该输入实例分为这个类。KNN使用的模型实际上对应于特征空间的划分,没有显式的训练过程。
2024-02-29 18:00:41 642
原创 感知机学习算法
感知机是感知机是一个二分类线性判别模型,其输入为实例的特征向量,输出为实例的类别,取+1和-1二值。感知机对应输入空间(特征空间)中将实例划分为正负两类的分离超平面,属于判别模型。
2024-02-28 10:22:59 603 2
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人