自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(8)
  • 收藏
  • 关注

原创 主成分分析PCA

主成分分析法是一个非监督学习的机器学习算法,主要用于数据的降维,对于高维数据,通过降维,可以发现更便于人类理解的特征。

2023-12-31 22:40:17 861 1

原创 支持向量机

求解上面的优化函数涉及到计算 ϕ(x(i))⋅ϕ(x(j))ϕ(x(i))⋅ϕ(x(j)),这是样本 x(i)x(i)和 x(j)x(j)映射到特征空间的内积,由于特征空间维度可能很高,甚至是无穷维,因此直接计算ϕ(x(i))⋅ϕ(x(j))ϕ(x(i))⋅ϕ(x(j))通常是困难的,避开这个障碍的一个方法是引入核函数(2)算法步骤和原来SVM一模一样,几乎不需要改动,只需要将 ϕ(x(i))⋅ϕ(x(j))ϕ(x(i))⋅ϕ(x(j))替换成 K(x(i),x(j))K(x(i),x(j))即可。

2023-12-18 19:09:47 867 1

原创 逻辑斯蒂回归

Logistic回归(Logistic Regression)是一种广泛使用的统计方法,用于建模和分析一个因变量与一个或多个自变量之间的关系,其中因变量是二进制的(即,它只有两个可能的结果,通常表示为0和1)。它通过应用一个逻辑函数(Logistic function),也称作Sigmoid函数或Logit函数,将线性回归的输出映射到0和1之间的概率。在Logistic回归的背景下,梯度下降用于最小化代价函数(Cost Function),这通常是似然函数的负对数。

2023-12-04 20:35:58 455

原创 朴素贝叶斯分类

然后,通过计算每个特征在垃圾邮件和正常邮件中的条件概率,利用贝叶斯公式计算邮件属于垃圾邮件和正常邮件的概率,最后比较两个概率的大小,将邮件分类为垃圾邮件或正常邮件。其中,P(A|B) 表示在事件 B 发生的条件下,事件 A 发生的概率;朴素贝叶斯分类器的训练器的训练过程就是基于训练集D估计类先验概率P(c),并为每个属性估计条件概率 P(x_i│c)。朴素贝叶斯分类器的基本思想是通过已知的训练样本数据来估计每个类别下各个特征的条件概率,并利用贝叶斯公式来计算给定特征条件下的后验概率,从而进行分类。

2023-11-20 21:18:51 70 1

原创 机器学习-决策树

决策树是一种常见的机器学习算法,用于解决分类和回归问题。它通过构建一个树状结构,每个非叶子节点表示一个特征,每个叶子节点表示一个类别或一个预测值。决策树的构建过程是递归的,从根节点开始,选择一个最佳特征将数据集分割成子集,然后对每个子集递归地构建子树。构建子树的过程可以通过一些指标,如信息增益、基尼系数等来选择最佳特征。决策树算法有一些优点,包括易于理解和解释、能够处理数值型和类别型数据、能够处理缺失值等。然而,决策树也存在一些缺点,如容易过拟合、对输入数据的小变化敏感等。

2023-11-06 17:36:50 188

原创 机械学习模型评估

精确率(Precision)和召回率(Recall):精确率和召回率常用于不平衡分类问题,其中精确率表示预测为正例的样本中真正为正例的比例,召回率表示真正为正例的样本中被预测为正例的比例。例如,在金融行业中,由于市场的变动,训练数据可能无法完全反映实际的市场情况。它表示的是在不同的分类阈值下,模型的精确率(Precision)和召回率(Recall)之间的关系。精确率是指模型预测为正例的样本中,实际为正例的比例,计算公式为:精确率 = TP / (TP + FP),其中TP表示真正例,FP表示假正例。

2023-10-23 20:47:33 147

原创 K-近邻算法

用官方的话来说,所谓K近邻算法,即是给定一个训练数据集,对新的输入实例,在训。如果K=5,绿色圆点的最近的5个邻居是2个红色三角形和3个蓝色的正方形,还是少数从属于多数,基于统计的方法,判定绿色的这个待分类点属于蓝色的正方形一类。如果K=3,绿色圆点的最近的3个邻居是2个红色小三角形和1个蓝色小正方形,少数从属于多数,基于统计的方法,判定绿色的这个待分类点属于红色的三角形一类。此外,k值的选择也会影响算法的性能,选择较小的k值容易受到噪声的影响,而选择较大的k值容易忽略样本之间的细节差异。

2023-10-09 21:19:44 43 1

原创 Anaconda安装

输入下面的五个环境变量(你需要将以下五条环境变量中涉及的到的"D:\anaconda3"都修改为你的Anaconda的安装路径)3.按照步骤点击Next、点击I agree、点击All Users,选择安装路径,点击Install,最后点击Finish。同时按 win + r ,输入cmd,在弹出的命令行查看anaconda版本,输入 :conda --version。计算机(右键)→属性→高级系统设置→(点击)环境变量。若出现版本号,即代表配置成功。在编辑环境变量里,点击新建。里,找到并点击Path。

2023-09-25 22:01:53 41 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除