自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 收藏
  • 关注

原创 交叉验证和网络搜索

交叉验证是一种数据集的分割方法,将训练集划分为n份,拿一份做验证集。 交叉验证法原理:将数据集划分为cv=4份。 交叉验证法,是划分数据集的一种方法,目的就是为了得到更加准确可信的模型评分。 1.为什么要网格搜索? 模型有很多超参数,其能力也存在很大的差异。需要手动产生很多超参数组合,来训练模型。 每组超参数都采用交叉验证评估,最后选出最优参数组合建立模型。得到的结果准确值如下图:

2024-04-25 21:37:02 194 1

原创 距离度量常见四种距离方式的及KNN算法对鸢尾花分类

实现流程有:tobo1.加载数据集 tobo2.数据展示 tobo3.数据基本处理 tobo4.特征处理 tobo5.实例化 tobo6.训练 tobo7.评估 tobo8.预测。特征的单位或者大小相差较大,或者某特征的方差相比其他的特征要大出几个数量级。通过对原始数据进行标准化,转换为均值为0标准差为。,使得一些模型(算法)无法学习到其它的特征。通过对原始数据进行变换把数据映射到。1.为什么做归一化和标准化?1的标准正态分布的数据。2.什么是数据归一化?

2024-04-24 19:41:43 609

原创 2024.4.23 Day02 特征工程

利用专业背景知识和技巧处理数据,让机器学习算法效果最好。这个过程就是特征工程.二.特征工程的设计内容(用图来表示)

2024-04-24 00:34:22 131

原创 2024.4.22 Day 1 AI ML DL

3.深度学习,也叫深度神经网络,是一种使用多层神经网络对数据进行高层抽象的机器学习技术。• 标签/目标(label/target) :模型要预测的那一列数据。• 特征(feature) :一列数据一个特征,有时也被称为属性。• 样本(sample) :一行数据就是一个样本。• 数据集dataset:多个样本组成数据集。:对人看到的东西进行理解.:对人交流的东西进行理解.:也属于人工智能的范畴.四.样本、特征、标签。

2024-04-22 10:51:13 167 1

原创 某电文由8个字母组成,字母出现的频率如下表所示,请写出字母的哈夫曼编码。

第二种算法:(2+3)*5+4*4+(7+10+15)*3+(22+37)*2=255。电文总长度换句话来说就是算权:第一种算法:2+3+4+5+7+9+16+22+38+10+15+25+37+62=255。要求:哈夫曼树中任意结点左孩子的权值均小于右孩子。哈夫曼编码通俗一点就是左孩子是1,右孩子是2.电文总长度(WPL)为 255位。

2023-11-09 00:38:16 1191

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除