自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(7)
  • 收藏
  • 关注

原创 机器学习——SVM

支持向量机(Support Vector Machine,SVM)是一种机器学习算法,用于分类和回归分析。它能够有效地处理线性可分和线性不可分的数据,并在高维空间中构建最优的决策边界。SVM的核心思想是找到一个超平面,将不同类别的样本点尽可能地分开,并且使得两个类别之间的间隔最大化。这个超平面称为最大间隔超平面,它可以很好地进行分类预测。具体而言,SVM通过将样本映射到高维特征空间,使得数据在该空间中线性可分。

2024-06-10 14:07:02 1008

原创 机器学习——logistic回归

逻辑回归(Logistic Regression)是机器学习中的一种分类模型,逻辑回归是一种分类算法,该算法的目的是预测二元输出变量(比如0或1),逻辑回归算法广泛运用于预测股票市场,顾客购买行为,诊断疾病等等。虽然名字中带有回归,但却是一种分类算法。优点:(1)训练速度较快,分类的时候,计算量仅仅只和特征的数目相关;(2)简单易理解,模型的可解释性非常好,从特征的权重可以看到不同的特征对最后结果的影响;(3)适合二分类问题,不需要缩放输入特征;

2024-05-28 15:58:40 978

原创 机器学习——朴素贝叶斯

贝叶斯公式又被称为贝叶斯规则,是概率统计中的应用所观察到的现象对有关概率分布的主观判断(先验概率)进行修正的标准方法。用数学语言表达就是:支持某项属性的事件发生得愈多,则该属性成立的可能性就愈大。朴素贝叶斯算法分析(1)朴素贝叶斯模型发源于古典数学理论,有稳定的分类效率。(2)对小规模的数据表现很好,能个处理多分类任务,适合增量式训练,尤其是数据量超出内存时,我们可以一批批的去增量训练。(3)对缺失数据不太敏感,算法也比较简单,常用于文本分类。

2024-05-14 17:23:38 543 1

原创 机器学习——决策树

ID3算法:ID3算法核心就是“最大信息熵增益” 原则选择划分当前数据集的最好特征。而且对于连续型特征,比如长度,密度都是连续值,无法在ID3运用,利用信息熵划分属性,会对倾向于可取值数目较多的属性。没有考虑过拟合的问题。CART算法:CART算法使用基尼系数来代替信息增益比,基尼系数代表了模型的不纯度,基尼系数越小,则不纯度越低,特征越好。这和信息增益及信息增益率是相反的。

2024-04-29 22:41:36 742

原创 机器学习——模型评估

此外,混淆矩阵多用于判断分类器(Classifier)的优劣,适用于分类型的数据模型,如分类树(Classification Tree)、逻辑回归(Logistic Regression)、线性判别分析(Linear Discriminant Analysis)等方法。模型评估指标中,AUC表示ROC曲线下的面积,用于衡量模型对正负样本的区分能力;ROC、AUC面积:一种常用的分类性能指标,表示在所有可能的分类阈值下模型的ROC曲线与y=x线之间的面积;PR曲线下的面积(AUC)越大,表示模型性能越优秀。

2024-04-16 16:21:42 782

原创 k近邻算法

它的思想很简单:如果一个样本在特征空间中的多个最近邻(最相似〉的样本中的大多数都属于某一个类别,则该样本也属于这个类别。此时有一个未标记的数据样本,我们的任务是预测出这个数据样本所属的类别。knn的原理是,计算待标记样本和数据集中每个样本的距离,取距离最近的k个样本。待标记的样本所属类别就由这k个距离最近的样本投票产生。knn算法的核心思想是未标记样本的类别,由距离其最近的k个邻居投票来决定。'电影2': [18, 90, '爱情片'],'电影3': [2, 81, '爱情片'],# 取前k个最近的距离。

2024-04-02 13:02:12 679

原创 Anaconda安装

第十七步:输入下面的五个环境变量,需要将以下五条环境变量中涉及的到的"D:\WorkSoftware\Install\Anaconda3"都修改为Anaconda的安装路径。第十八步:检验安装是否成功同时按 win + r ,输入cmd,在弹出的命令行查看anaconda版本,输入:conda --version。: 查看用户自己设置的环境变量,双击path后面的值,进入查看自己设置过的环境变量。第十四步:配置环境变量,高级系统设置→(点击)环境变量。第十六步:在编辑环境变量里,点击新建。

2024-03-19 12:46:15 323

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除