自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 收藏
  • 关注

原创 打卡第四天

这段代码首先加载了鸢尾花数据集,然后对数据进行了标准化处理,接着将数据集划分为训练集和测试集,创建了一个KNN分类器,并使用训练集数据训练了模型。2. 数据预处理:在分类之前,我们可能需要对数据进行预处理,例如标准化特征值,使得每个特征的均值为0,标准差为1。通常,可以使用`train_test_split`函数来随机划分数据集,确保训练集和测试集的分布尽可能相似。在实际应用中,具体选择归一化还是标准化取决于数据集的特点和模型的要求,可以通过尝试不同的预处理方法来找到最适合的方案。

2024-04-26 10:23:32 284 1

原创 KNN算法相关介绍

KNN 算法的核心思想是"近朱者赤,近墨者黑",即认为距离相近的样本在特征上也更为相似,因此具有相似的分类。KNN 算法,即 K-最近邻算法,是一种基于实例的学习方法,它通过计算待分类样本与训练集中已标记样本的距离,选择其中距离最近的 k 个样本作为邻居。具体地说,对于一个给定的测试样本 x,KNN 算法会计算 x 与训练集中每个样本的距离,然后将 x 与距离最近的 k 个样本归为一类(或者根据这 k 个样本的多数类来确定 x 的分类)。+ `n_neighbors`:整数,指定要考虑的邻居的数量。

2024-04-26 10:11:49 279 1

原创 第二天打卡

在实际应用中,避免过拟合和欠拟合是重要的,过拟合是指模型过于复杂,捕捉了数据中的噪声而不是潜在的趋势,而欠拟合是指模型过于简单,无法捕捉数据中的重要信息。过拟合通常是由于模型过于复杂,或者训练数据过多,导致模型学习到了数据中的噪声和特定于训练集的细节,而没有捕捉到数据的真实、普适性的规律。1. **模型选择**:根据数据的特点和问题的需求,选择一个合适的数学模型。是机器学习和统计模型训练中的一个问题,指的是模型过于简单,无法捕捉到数据中的重要模式和特征,导致在训练集和测试集上的表现都不好。

2024-04-23 15:08:13 763

原创 第一天打卡

机器学习作为一门跨学科的技术,正改变着我们的生活方式和工作方式。2. 无监督学习(Unsupervised Learning):无监督学习是指让计算机从无标签的数据中学习,挖掘数据内在的结构和规律,主要包括聚类(Clustering)和降维(Dimensionality Reduction)等方法。1. 监督学习(Supervised Learning):监督学习是一种让计算机通过已知的输入和输出关系来学习的方法,主要包括回归(Regression)和分类(Classification)问题。

2024-04-22 22:40:39 826

原创 机器学习导论

机器学习作为一门跨学科的技术,正改变着我们的生活方式和工作方式。2. 无监督学习(Unsupervised Learning):无监督学习是指让计算机从无标签的数据中学习,挖掘数据内在的结构和规律,主要包括聚类(Clustering)和降维(Dimensionality Reduction)等方法。1. 监督学习(Supervised Learning):监督学习是一种让计算机通过已知的输入和输出关系来学习的方法,主要包括回归(Regression)和分类(Classification)问题。

2024-04-22 22:37:27 536

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除