自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 收藏
  • 关注

原创 交叉验证与网格搜索

原理:只需要将若干参数传递给网格搜索对象,它自动帮我们完成不同超参数的组合、模型训练、模型评估,最终返回一组最优的超参数。交叉验证是一种数据集分割方式,将数据集划分为n份,取一份做测试集,其他n-1份做训练集。•模型有很多超参数,其能力也存在很大的差异。•每组超参数都采用交叉验证评估,最后选出最优参数组合建立模型。•交叉验证解决模型的数据输入问题(数据集划分)得到更可靠的模型。•网格搜索+交叉验证的强力组合(模型选择和调优)目的:模型调参的工具,寻找最优超参数的工具。•网格搜索解决超参数的组合。

2024-04-25 22:28:24 417

原创 四种距离计算方法及鸢尾花分类

两点坐标(|x1-x2|,|y1-y2|)中取最大值即为距离。例max(|6-3|,|5-4|)=2。交叉验证:是数据集的分割方法,将训练集划分为n份,拿一份做测试集,其他n-1份做训练集。p是参数:p=1时为曼哈顿距离,p=2时为欧氏距离,p=∞时为切比雪夫距离。例:A(2,2),B(1,1)则AB=|2-1|+|2-1|=2。特征的单位或大小相差大,或某特征的方差比其他的大的多,影响结果。交叉验证解决模型的数据输入问题(数据集划分)得到更可靠的模型。网格搜索:是模型调参的有力工具。

2024-04-24 22:22:04 591

原创 特征工程及KNN算法

提取与任务相关的特征:特征缩放1、归一化:将特征缩放到一个特定的范围,通常是[0, 1]。2、标准化:将特征缩放为均值为0,标准差为1的分布。:会影响原始数据:不会形象原始数据:将相关性大的组合在一起:模型对样本点的拟合情况模型在训练集和测试集表现都差,产生原因是因为模型过于简单。可采取增加特征值解决。模型在训练集表现好,测试集表现差,产生原因是模型过于复杂而训练数据少。可增加训练数据。

2024-04-23 23:09:06 687

原创 机器学习概述

人工智能(AI),机器学习(ML),深度学习(DL)。

2024-04-22 16:53:14 522 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除