自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 收藏
  • 关注

原创 超参数选择方法

只需要将若干参数传递给网格搜索对象,它自动帮我们完成不同超参数的组合、模型训练、模型评估, 最终返回一组最优的超参数。是一种数据集的分割方法,将训练集划分为 n 份,拿一份做验证集 (测试集)、其他n-1份做训练集。在传统的调优中,我们通过手动检查随机超参数集来训练算法,并选择最适合我们目标的参数集。• 模型有很多超参数,其能力也存在很大的差异。交叉验证法,是划分数据集的一种方法,目的就是为了得到更加准确可信的模型评分。• 交叉验证解决模型的数据输入问题(数据集划分)得到更可靠的模型。

2024-04-25 20:57:38 327 1

原创 特征工程预处理

通过⼀些转换函数将特征数据转换成更加适合算法模型的特征数据过程归一化标准化目的:特征的单位或者大小相差较大,或者某特征的方差相比其他的特征要大出几个数量级,容易影响 (支配)目标结果,使得一些模型(算法)无法学习到其它的特征。注意最⼤值最⼩值是变化的,另外,最⼤值与最⼩值⾮常容易受异常点影响,所以这种⽅法鲁棒性较差,只适合传统精 确⼩数据场景。在已有样本⾜够多的情况下⽐较稳定,适合现代嘈杂⼤数据场景。这就是一个用KNN-算法实现分类,训练,评估和预测的完整的鸢尾花案例的代码#加载数据#数据展示。

2024-04-24 21:07:10 532 1

原创 KNN算法

k近邻法(k-nearest neighbor, kNN)是一种基本的分类与回归方法;是一种基于有标签训练数据的模型;是一种监督学习算法。,作为监督学习,那么KNN模型需要的是有标签的训练数据,对于新样本的类别由与新样本距离最近的k个训练样本点按照分类决策规则决定。第二,k值的选择(找出训练集中与带估计点最靠近的k个实例点);出现了一些问题,scipy版本不兼容。kNN是一个基本而简单的。第一,确定距离度量;第三,分类决策规则。

2024-04-23 21:53:13 286

原创 机器学习算法分类

指对数据的若干特征与若干标签(类型)之间的关联性进行建模的过程; 只要模型被确定,就可以应用到新的未知数据上。这类学习过程可以进一步分为「分类」(classification)任务和「回归」(regression)任务。在分类任务中,标签都是离散值;而在回归任务中,标签都是连续值。线性回归是用于预测回归问题的算法。算法根据训练数据计算参数,使得损失最小,这种做法是有监督学习算法的共同之处。表示误差和学习参数之间关系的函数叫做 误差函数(或损失函数)。线性回归中,通常会用均方误差作为误差函数。L ( w 0

2024-04-22 17:10:03 756 1

原创 机器学习概述总结

深度学习是机器学习的一种方法,它是通过构建和训练深层神经网络来实现学习和特征提取的过程。:机器学习是人工智能的一个重要分支,它是让计算机通过从数据中学习和提取模式,自动改进执行特定任务的能力。在传统编程中,程序员需要明确指定计算机应该如何执行任务,而在机器学习中,计算机通过学习数据的规律和特征自主地进行任务执行,这种方式使得计算机在面对新的情况时也能做出合理的决策。图中的是动物,还是人,还是其他的物体。(如芒果的大小,颜色,产地,品牌等)传统的监督学习,或者非监督学习,或者与深度学习相结合的方式。

2024-04-22 11:23:28 578

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除