自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(3)
  • 收藏
  • 关注

原创 特征工程概念----day03

PCA的优势在于能够去除数据中的冗余信息,减少数据的复杂性,同时保留数据中的主要结构。如果有三种颜色(红、绿、蓝),则独热编码会将这三种颜色分别编码为[1, 0, 0]、[0, 1, 0]、[0, 0, 1]。为依据的,从而使得映射后的数据在第一个主成分(方差最大的方向)上具有最大的方差,依次类推。如果有三个等级(低、中、高),则标签编码可以将它们分别映射为0、1、2。的情况,例如颜色(红、绿、蓝)、国家(美国、加拿大、澳大利亚)等。的情况,例如等级(低、中、高)或年龄组(青年、中年、老年)等。

2024-08-05 21:30:00 169

原创 机器学习建模流程 day02

模型参数是模型在训练过程中学习得到的,用于描述数据的特征或关系;泛化能力(generalization ability)指的是机器学习模型对未见过的数据的适应能力或表现能力。数据库是计算机里面的存储的数据的,当然可以对数据进行一些操作增删改查,通常用于存储大量结构化数据,并提供高效的数据操作和查询功能。数据漂移就是一种影响因素。数据漂移(Data Drift)是指在机器学习模型部署后,输入数据的分布发生变化,导致模型的性能下降的现象。

2024-08-04 21:30:00 651

原创 人工智能一些基础知识的理解 day01

举个例子:西瓜的好坏可以由色泽、根蒂、敲声等来决定,我们可以对 这些特征进行归纳,那些特征同时出现的概率高,比如色泽青绿的瓜更 容易出现根蒂蜷缩的情况(也就是关联分析)或者一个未标记的数据集, 并且想要根据色泽特征将其分成两个组(类似聚类,旨在将数据集中的 样本划分为不同的组,使得组内的样本尽可能相似,而组间的样本尽可 能不同)或者通过PCA(就是一些数学算法)将西瓜的主特征进行数字 化,从而形成新的数据表达形式(也就是降维)。特征是事物本身的特征比如说西瓜的色泽是怎么样的;

2024-08-03 21:30:00 195

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除