自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 收藏
  • 关注

原创 KNN算法3

是一种数据集的分割方法,将训练集划分为n份,拿一份做验证集(测试集)、其他n-1份做训练集。# 模型保存joblib.dump(estimator, 'model/knn.pth')data = pd.read_csv('data/手写数字识别.csv')print('测试集准确率: %.2f' % acc)利用KNN算法实现手写数字识别。# 数据预处理归一化。

2024-04-26 10:18:35 156

原创 KNN算法2

简而言之,归一化通常用于将数据限制在特定范围内,而标准化则是为了调整数据的分布,使其具有零均值和单位标准差。这两种方法都有助于提高数据的一致性和算法的性能。特征的单位或者大小相差较大,或者某特征的方差相比其他的特征要大出几个数量级,容易影响(支配)目标结果,使得一些模型(算法)无法学习到其它的特征。•归一化和标准化都是数据预处理技术,旨在调整数据的尺度,但它们的方法和适用场景有所不同。# 5 打印每1列数据的均值和标准差。# 4. 打印归一化后的结果。为什么做归一化和标准化?归一化的标准话的概念。

2024-04-25 17:52:21 841 1

原创 机器学习day two与knn算法

特征工程是机器学习和数据科学中的一个关键步骤,它涉及到利用领域知识来创建或选择合适的特征,这些特征能够更好地描述数据,并提升机器学习模型在未知数据上的性能。通过有效的特征工程,即使使用相对简单的模型,也能获得良好的性能,因为好的特征能够提高模型的灵活性和预测精度。特征工程包括去除无关数据、选择与结果高相关的特征、以及设计能够更好表达问题本质的特征,从而增强模型的预测能力。特征工程概念入门–涉及内容1.特征提取feature extraction从原始数据中提取与任务相关的特征。

2024-04-23 22:38:19 879

原创 机器学习day one

(Artificial Intelligence,简称AI )是一门研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的新技术科学。它是计算机科学的一个分支,旨在理解和复制智能的本质,并生产出能够以人类智能相似的方式做出反应的智能机器。◆定义:输入数据没有被标记,即样本数据类别未知,没有标签,根据样本间的相似性,对样本集聚类,以发现事物内部结构及相互关系。2监督学习:输入训练集数据包含输入特征值和目标值回归:函数的输出是一个连续的值分类:函数的输出是有限个离散值。

2024-04-22 17:18:38 366

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除