自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 收藏
  • 关注

原创 线性回归模型

线性回归是一种预测数值型数据的监督学习算法。它假设目标变量(因变量)与一个或多个自变量之间存在线性关系。线性回归模型通过寻找最佳拟合线(在多维空间中为超平面),来预测目标变量的值。

2024-09-17 21:50:26 442

原创 监督学习详解:从基础到应用

假设我们想要预测图片中的数字是几,这就是一个典型的分类问题。在数据集中,每个图片都被标注了对应的数字(0-9),模型通过学习这些图片及其标签,能够学会从新的图片中预测出数字。非监督学习(Unsupervised Learning)在机器学习领域有着广泛的应用场景,这些场景通常涉及到对未标记数据的学习和探索。监督学习广泛应用于各种预测和分类问题中,如预测股票价格、判断图片中的物体类型、推荐系统等。回归问题是一种预测数值型数据的监督学习方法。分类问题是监督学习中的另一大类问题,其目标是预测数据的类别标签。

2024-09-14 18:42:34 919

原创 模型评估与模型参数选择:深入理解机器学习

由于我们的目标是让模型在未知数据上表现良好,因此泛化误差是衡量模型泛化能力的重要标准。过拟合是指模型在训练集上表现很好,但在测试集上表现不佳的现象。欠拟合则是指模型未能充分学习数据的特征,导致在训练集和测试集上的表现都不佳。目的:数据集划分的主要目的是将原始数据集分割成不同的部分,以便用于训练、验证和测试模型。:用于调整模型的超参数,确保模型在未知数据上表现最佳。:用于最终评估模型的效果,提供模型性能的最终指标,最终评估模型的泛化能力,如准确率、精确率、召回率和F1分数等。

2024-09-14 17:35:26 928

原创 机器学习中的学习理论

我们在假设一个模型来拟合数据集时,需要找到最合适的模型,不断地扩大数据集、增加提取特征是见效甚微的方法,比较好的是对数据集进行合理的划分,将整个数据集划分为三个部分:训练集、交叉检验集和测试集。应用非常广泛,以下是一些常见的应用场景:1、用户行为分析:通过对用户行为数据的统计分析,我们可以了解用户的喜好和习惯,从而优化产品设计,提升用户体验。我们通常通过对样本的研究,来推断总体的性质。4、有监督的机器学习中,我们可以概述为通过很多有标记的数据,训练出一个模型,然后利用这个,对输入的X进行预测输出的Y。

2024-09-07 13:30:40 401

原创 机器学习算法与流程

聚类应用领域广泛,可以用于发现不同的企业客户群体特征、消费者行为分析、市场细分、交易数据分析、动植物种群分类、医疗领域的疾病诊断、环境质量检测等,还可用于互联网和电商领城的客户分析、行为特征分类等。在聚类的过程中,首先选择有效特征构成向量,然后按照欧氏距离或其他距离函数进行相似度计算,并划分聚类,通过对聚类结果进行评估,逐渐选代生成新的聚类。聚类方法可分为基于层次的聚类、基于划分的聚类、基于密度的聚类、基于约束的聚类、基于网络的聚类等。4、回归分析:线性回归、逻辑回归、多项式回归、岭回归、LASSO回归。

2024-09-07 13:30:20 823 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除