机器学习
文章平均质量分 63
机器学习各种算法原理
薄荷杂学
触底反弹
展开
-
ML模型评估
一、评估方法 留出法hold-out 留出法直接将数据集D划分为两个互斥的集合,其中一个集合作为训练集S,另一个作为测试集T,即$D=S \cup T,S \cap T = \varnothing ,在,在,在S上训练处模型后,用上训练处模型后,用上训练处模型后,用T$来评估其测试误差,作为对泛化误差的估计。 注意:训练/测试集的划分要尽可能保存数据分布的一致性,避免因数据划分过程引入额外的偏差而对最终结果产生影响。——例如,在分类任务中至少要保存样本的类别比例相似。 交叉验证cross validatio原创 2021-09-14 22:22:14 · 208 阅读 · 0 评论 -
ML基本概念
数据集data set 样本sample、示例instance 特征feature、属性attribute 属性值attribute value 属性空间attribute space、样本空间sample space——属性张成的空间 特征向量feature vector——样本可以在空间中找到自己的坐标位置,由于空间中的每个点对应一个坐标向量,因此可以把一个示例称为一个特征向量 学习learning、训练training——从数据中学到模型的过程;学得模型对应了关于数据的某种潜在规律——假设hypoth原创 2021-09-13 15:43:08 · 206 阅读 · 0 评论