自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(3)
  • 收藏
  • 关注

原创 机器学习第三天

• 特征提取 :从原始数据中提取与任务相关的特征•特征预处理:特征对模型产生影响;因量纲问题,有些特征对模型影响大、有些影响小• 特征降维:将原始数据的维度降低,叫做特征降维• 特征选择 :把多个的特征合并成一个特征。一般利用乘法或加法来完成要做到归一化和标准化:特征的单位或者大小相差较大,或者某特征的相比其他的特征要大出几个数量级,容易影响 (支配),使得一些模型(算法)。

2024-04-24 23:09:07 496

原创 机器学习第二天

我们可以这么理解:离散就是规定好有有限个类别,这些类别是离散的。连续就是理论上可以取某一范围内的任意值,比如现在28°,当然这是我们测出来的,但是实际温度可能是无限趋于28。也就是说,回归并没有要求你的值必须是那个类别,你只要能回归出一个值,在可控范围内即可。knn算法是机器学习最简单,最基础的算法之一。样本空间内的两个点之间的距离量度表示两个样本点之间的相似程度:距离越短,表示相似程度越高;,距离较远的点(与预测实例不相似)会对预测结果产生影响,使得预测结果产生较大偏差,此时模型容易发生。

2024-04-23 22:48:36 446

原创 机器学习day1

SVM的目标是找到这样一个超平面,使得不同类别的样本点被有效地分开,并且距离这个超平面最近的样本点的间隔最大。当然,机器学习领域还有很多深入的知识等待您去探索。预处理的主要目标是提高数据质量,确保数据的一致性和准确性,从而为后续的特征工程、模型训练等步骤奠定坚实的基础。总的来说,决策树和随机森林都是强大的机器学习工具,它们各自的特点使得它们在不同的问题和场景中都能发挥出色的性能。缺失值处理:识别数据中的缺失值,并采取适当的措施,如删除包含缺失值的样本、使用插补方法填补缺失值,或使用特定的占位符表示缺失值。

2024-04-22 17:03:02 1020

空空如也

PTA平台7—-29

2023-03-01

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除