- 博客(5)
- 收藏
- 关注
原创 【4】KNN算法
某一未知样本的类别是在特征空间里中,居于的类别计算两个样本Aa1a2a3Bb1b2b3dABa1−b12a2−b22a3−b32dAB∣a1−b1∣∣a2−b2∣∣a3−b3∣k值若太小,容易受到异常值的影响k值若太大,容易受到样本数量分布的影响。
2023-04-21 16:34:02 61 1
原创 【2】如何从sklearn中读取数据集
通过datasets.fetch(),我们可以从网上获取数据集并保存到本地,data_home为保存路径,当为None时,会放在根目录下的 scikit_learn_data 文件夹中。返回值有四个,从左至右分别是特征值(训练集),特征值(测试集),目标值(训练集),目标值(测试集)。这里的特征维度很少,只有四个,实际上特征值数量可以达到数千以上,我们使用机器学习正是要挖掘出这些特征蕴含的信息。在不考虑验证集的情况下,可以将数据集划分为训练集和测试集,一般训练集占所有数据的。其中特征值是一个二维数组。
2023-04-17 16:36:04 861 1
原创 【1】从初学者开始的机器学习记录
人们倾向于从经验中获得信息,这被称之为学习。然而,当面对大量数据的时候,其数据内部关系错综复杂,人力能学习到的东西相当有限。因此,我们需要借用计算机来帮助我们学到隐藏在数据中的各式信息。可以说,机器学习既是让机器去学习,也是人们利用机器去学习。
2023-04-16 16:40:33 63
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人