自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(9)
  • 收藏
  • 关注

原创 词嵌入(word2vec)

在自然语言系统中,词被看作最为基本的单元,如何将词进行向量化表示是一个很基本的问题,词嵌入(word embedding)就是把词映射为低维实数域向量的技术。提示:以下是本篇文章正文内容,下面案例可供参考。

2024-04-20 10:39:51 803

原创 提升方法AdaBoost算法

提升方法是一种常用的统计学习方法,应用广泛且有效。在分类问题中,通过改变训练样本的权重,学习多个分类器,并将这些分类器线性组合,提高分类的性能。

2024-04-14 22:31:51 1130 1

原创 支持向量机

文章目录前言一、SVM要解决的问题是什么?二、线性支持向量机与硬间隔最大化三、学习的对偶算法对偶问题的转化对偶问题的求解四、线性支持向量机与软间隔最大化五、 非线性支持向量机与核函数六、SMO算法(序列最小最优化算法)六、代码实现前言支持向量机是一种二分类模型。他的基本模型是定义在特征空间上的间隔最大的线性分类器,间隔最大使它区别于感知机。一、SVM要解决的问题是什么?对于上图中这样一个二分类线性可分问题,期望找到一个分类超平面将正负类分开,SVM就是一个用来寻找这样的分类超平面的算法。定义

2024-04-02 21:31:11 633 1

原创 最大熵模型

文章目录前言一、最大熵模型是什么?二、极大似然估计三、模型学习的最优化算法四、代码实现前言最大熵模型是由最大熵原理推导实现。最大熵原理是概率模型学习的一个准则,该原理认为在已知约束条件下,且没有其他的先验知识来限制模型时,选择具有最大熵的模型,可以保证不会引入偏见。一、最大熵模型是什么?最大熵原理应用到分类得到最大熵模型。给定训练集T=(x1,y1),(x2,y2),...,(xN,yN)T={(x_1,y_1),(x_2,y_2),...,(x_N,y_N)}T=(x1​,y1​),(x2​

2024-03-23 18:40:49 1053

原创 逻辑斯谛回归模型

逻辑斯蒂回归是统计学的经典分类方法,属于对数线性模型。

2024-03-23 17:18:04 604

原创 决策树的算法(ID3,C4.5, CART)

决策树(design tree)是一种基本的分类与回归的方法。在学习过程中,利用训练数据,根据损失函数最小化原则建立决策树模型。预测时,对于新的数据用决策树模型进行分类。决策树学习通常包括三个步骤:特征选择、决策树的生成和决策树的修剪。

2024-03-12 22:12:44 1002 2

原创 朴素贝叶斯法

朴素贝叶斯(naive Bayes)法是基于贝叶斯定理和特征条件独立假设的分布方法。对于给定的训练数据集,首先基于特征条件独立独立假设学习输入输出的联合概率分布。然后基于此模型,对于给定的输入x,利用贝叶斯定理求出后验概率最大的输出。

2024-03-03 15:51:16 807 2

原创 k近邻法的实现

k近邻法是一种基本分类与回归方法。给定一个训练数据集,其中的实例类别已定,对新的输入实例,在训练数据集中找到与该实例最近邻的k个实例,这k个实例的多数属于某个类,就把该输入实例分为这个类。KNN使用的模型实际上对应于特征空间的划分,没有显式的训练过程。

2024-02-29 18:00:41 642

原创 感知机学习算法

感知机是感知机是一个二分类线性判别模型,其输入为实例的特征向量,输出为实例的类别,取+1和-1二值。感知机对应输入空间(特征空间)中将实例划分为正负两类的分离超平面,属于判别模型。

2024-02-28 10:22:59 603 2

词嵌入(word2vec)

word2vec的实现过程,包含原始数据的处理和词向量的训练

2024-04-20

朴素贝叶斯法(文本分类的数据集)

文本分类的数据集

2024-03-03

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除