自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(6)
  • 收藏
  • 关注

原创 超参数选择方法

网格搜索是模型调参的有力工具。只需要将若干参数传递给网格搜索对象,它自动帮我们完成不同超参数的组合、模型训练、模型评估,最终返回一组最优的超参数。5.若k=5模型得分最好,再使用全部训练集(训练集+验证集)对k=5模型再训练一边,再使用测试集对k=5模型做评估。•交叉验证:是一种数据集的分割方法,将训练集划分为n份,拿一份做验证集(测试集)、其他n-1份做训练集。交叉验证法,是划分数据集的一种方法,目的就是为了得到更加准确可信的模型评分。4.使用训练集+验证集多次评估模型,取平均值做交叉验证为模型得分。

2024-04-25 21:04:51 228 1

原创 乳腺癌数据

最小 最大。

2024-04-25 18:03:32 221 1

原创 距离度量+特征预处理

特征的单位或者大小相差较大,或者某特征的方差相比其他的特征要大出几个数量级,容易影响(支配)目标结果,使得一些模型(算法)无法学习到其它的特征。是对多个距离度量公式的概括性的表述。标准化:通过对原始数据进行标准化,转换为均值为0标准差为1的标准正态分布的数据。3. 切比雪夫距离:二个点之间的距离定义是其各坐标数值差绝对值的最大值。1. 欧氏距离:两个点在空间中的距离一般都是指欧氏距离。4. 闵可夫斯基距离:不是一种新的距离的度量方式。1. 为什么做归一化和标准化?

2024-04-24 21:09:09 290

原创 机器学习+KNN算法

k过小:过拟合 k过大:欠拟合。:一个样本最相似的k个样本中的大多数属于某一个类别,则该样本也属于这个类别。解决方法:过拟合可以通过正则化、异常值检测、特征降维等方法来解决。★过拟合产生的原因:模型太过于复杂、数据不纯、训练数据太少。★欠拟合产生的原因:模型过于简单,特征过少。②特征预处理:将数据标准化,归一化的处理。解决方法:拟合可以通过增加特征来解决。⑤特征组合:把多个特征合成一个特征。

2024-04-23 21:34:31 211

原创 机器学习(第一天)

2017年10月18日,DeepMind团队公布了最强版AlphaGo,代号AlphaGo Zero,它能在无任何人类输入的条件下,从空白状态学起,自我训练的时间仅为3天,自我对弈的棋局数量为490万盘,能以100:0的战绩击败前辈。这个模型的提出,开启了深度网络机器学习的新时代。进入90年代,多浅层机器学习模型相继问世,诸如逻辑回归,支持向量机等,这些机器学习算法的共性是数学模型为凸代价函数的最优化问题,理论分析相对简单,容易从训练样本中学习到内在模式,来完对象识别,人物分配等初级智能工作。

2024-04-22 21:08:51 778 1

原创 每天收获总结

获取数据--数据基本处理--特征工程--机器学习--模型评估--模型预测。4.监督学习目标值连续:回归 目标值离散:分类。3.一行数据就是一个样本,多个样本组成一个数据集。TPU:专门针对大型网络训练而设计的一款处理器。无监督学习:无目标值,根据样本的特征进行聚类。半监督学习:部分有目标值,部分没有目标值。一列数据就是一个特征,有时也被称为特征。1.AI发展三要素:数据,算法,算力。模型要预测的那一列数据成为目标或标签。CPU:主要适合I/O密集型的任务。GPU:主要适合计算密集型任务。

2024-04-22 17:40:36 127

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除