自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 收藏
  • 关注

原创 利用KNN算法实现手写数字识别

1 数据文件 train.csv 和 test.csv 包含从 0 到 9 的手绘数字的灰度图像。5 训练集中的特征名称均有pixel前缀,后面的数字([0,783])代表了像素的序号。第一列为 "标签",为该图片对应的手写数字。其余784列为该图像的像素值。3 每个像素取值范围[0,255],取值越大意味着该像素颜色越深。2 每个图像高 28 像素,宽28 像素,共784个像素。训练该模型并将其保存在目录为model的文件里。找到测试集图片,并调用模型进行测试。展示数据内下标为1的图片。

2024-04-25 22:35:04 477 1

原创 特征预处理

特征的单位或者大小相差较大,或者某特征的方差相比其他的特征要大出几个数量级,容易影响。应用场景,归一化适合传统精确小数据场景,标准化适合现代嘈杂大数据场景。出现异常点,归一化受影响较大,标准化受影响相对较小。(支配)目标结果,使得一些模型(算法)无法学习到其它的特征。# 3 数据集预处理-数据标准化。1.为什么做归一化和标准化?# 4 机器学习(模型训练)3.KNN算法对鸢尾花分类。# 2 数据基本处理。

2024-04-24 21:53:17 359 3

原创 特征工程入门和拟合问题以及机器学习开发环境

• 泛化 Generalization :具体的、个别的扩大为一般的能力。• 泛化 Generalization :具体的、个别的扩大为一般的能力。4 特征降维:原始特征较多,但是对模型训练相关的是其中一个特征集合子集。• 奥卡姆剃刀原则:给定两个具有相同泛化误差的模型,倾向选择较简单的模。• 过拟合产生的原因:模型太过于复杂、数据不纯、训练数据太少。• 欠拟合:模型在训练集上表现很差、在测试集表现也很差。2 特征预处理:从原始数据中提取与任务相关的特征。3 特征降维:从原始数据中提取与任务相关的特征。

2024-04-23 21:37:56 153

原创 洛谷P1093奖学金 python

今天是认知实习的第一天,老师要求每天写一篇博客,这次混一下,前段时间一道洛谷题,一道排序题,当时看大佬的题解有点不同想法。

2024-04-22 10:30:03 596 2

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除