自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 收藏
  • 关注

原创 Python机器学习库sklearn数据预处理,数据集构建,特征选择

注:当使用独热编码对数据集进行编码时,必须小心其会带来的多重共线性,对于某些方法这可能会带来问题(例如那些需要进行矩阵求逆的方法)。删除之后特征信息仍然得到保存,因为观察到另外几种特征为零,就可知余下的观察结果为被删除的一列。目前,将不同的特征缩放到相同的区间有两种常用的方法:归一化和标准化。我们发现,执行上面的代码之后,Numpy阵列X的第一列现在有了新的颜色值,其编码格式如下。多数情况下,归一化指的是将特征的值放到区间[0,1],它是最小-最大缩放的一个特例。

2023-09-25 22:59:06 284 1

原创 DNN简介——西瓜数据集案例

最左边的是输入层,最右边的是输出层,中间是多个隐含层,输入层开始,从左往右计算,逐层往前直到输出层产生结果。如果结果值和目标值有差距,再从右往左算,逐层向后计算每个节点的误差,并且调整每个节点的所有权重,反向到达输入层后,又重新向前计算,重复迭代以上步骤,直到所有权重参数收敛到一个合理值。全连接神经网络(DNN)是一种多层无监督神经网络,并且将上一层的输出特征作为下一层的输入进行特征学习,通过逐层特征映射后,将现有空间样本的特征映射到另一个特征空间,以此来学习对现有输入具有更好的特征表达。

2023-09-13 22:05:05 1857

原创 超详细数据预处理过程

数据预处理对于机器学习任务的成功至关重要,以下是机器学习技术进行数据预处理的步骤和方法。

2023-09-13 19:53:05 799 1

原创 机器学习常见无监督算法总结

无监督学习输入数据没有被标记,也没有确定的结果,样本数据类别未知,需要根据样本间的相似性对样本集进行分类。常用的无监督模型主要指各种聚类,主要有K均值聚类、层次聚类、密度聚类等。

2023-09-07 11:39:22 557 1

原创 监督学习(回归和分类)常见算法总结

监督学习的目的是让模型能够从已知的输入和输出之间的关系中学习,并且能够对新的输入做出正确的预测。

2023-09-07 10:38:17 5160 2

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除