- 博客(3)
- 收藏
- 关注
原创 机器学习的方法
一、模型评估与误差模型输出偏离真实目标值说明模型存在误差,用损失函数来度量偏离的程度,训练集上的平均误差称为训练误差,测试集上的误差称为泛化误差,泛化误差是衡量模型泛化能力的重要标准。1、数据集:数据集包括训练集、验证集和测试集。训练集相当于上课学知识,验证集相当于课后练习题,用来纠正和强化学到的知识,测试集相当于期末考试,用来最终评估学习效果。对于小规模样本集,常用划分比例为训练集:验证集:测试集 = 6:2:2或训
2024-09-17 20:16:21 300
原创 机器学习中的统计学习理论
在机器学习中,数据的丰富性和 质量直接影响统计学习模型的性 能上限。模型假设需符合实际数据分布,如支持向量机假设数据在高维空间可分,数据分布的多样。通过交叉验证技术,如K折交叉验证,可以评估模型假设在不同数据集上的泛化能力,确。监督学习依赖于带有已知标签的数据集进行模型训练,通过比较预测值与真实值调。无监督学习无需标签数据,通过聚类、降维等技术探索数据内在结构和隐藏模式。半监督学习利用有限的标签数据和大量无标签数据共同训练模型,提高学习效率和。通过数据验证假设,可确保模型的有效应用。4.强化学习试错优化。
2024-09-08 13:51:47 185
原创 机器学习的算法与流程
机器学习的主要流程是明确分析目标、数据收集、数据预处理、建模分析、结果评估、部署使用以及学习更新。机器学习的流程就是通过分析训练集中的数据,为每个类 别做出准确的描述或建立分析模型或挖掘出分 类规则,然后用这个分类规则对其它数据对象 进行分类。支持向量机,决策树,Bayesian网络.2.聚类算法;聚类就是K-means基于划分的聚类K均值(K-Means)基于密度的聚类3.回归分析;是一种研究自变量和因变量之间关系 的,用于分析当自变量发生变化时, 因变量的变化值。4推荐算法。
2024-09-08 13:20:11 333
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人