机器学习
文章平均质量分 92
lucas_ch
这个作者很懒,什么都没留下…
展开
-
机器学习05-神经网络
机器学习-神经网络 1、神经元模型 M-P神经元模型 来自n个其他神经元的输入信号通过权重汇总,与阈值进行比较,然后通过激活函数activation function处理产生输出。许多神经元按照一定的层次结构连接组成神经网络。 理想的激活函数为阶跃函数,但具有不连续、不光滑的不太好的性质 实际常用Sigmoid函数 2、感知机与多层网络 由两层神经元构成 输入层接受外界输入信号 输出层是M-P神经元 通过训练数据集学习ω\omegaω和θ\thetaθ,阈值θ\thetaθ可看作固定输入为-1的原创 2021-07-02 17:21:13 · 375 阅读 · 1 评论 -
机器学习04-决策树
机器学习-决策树 1、基本流程 当前结点包含的样本全属于同一类别,无需划分 当前属性集为空,或是所有样本在所有属性上取值相同,无法划分 当前结点包含的样本集合为空,不能划分 2、划分选择 决策树学习的关键是算法第8行,即如何选择最优划分属性。 随着划分进行,目标为决策树的分支结点所包含的样本尽可能属于同一类别,即结点的纯度purity越来越高。 2.1、信息增益 信息熵,度量样本集合纯度最常用的一种指标,信息熵越小,纯度越高。集合D的信息熵为 信息增益,样本集D的信息熵减去用属性a分类后各结点信息原创 2021-07-01 10:55:47 · 249 阅读 · 0 评论 -
机器学习01-模型评估与选择
机器学习01-模型评估与选择 1、经验误差与过拟合 错误率E=a/mE=a/mE=a/m=样本分类错误/样本总数 精度=1-错误率 在训练集上的误差称为训练误差或经验误差 新样本上的误差称为泛化误差 2、评估方法 测试集->测试误差 作为泛化误差的近似 测试集应尽可能与训练集互斥 产生训练集S和测试集T 2.1、留出法 直接将数据集DDD分为两个互斥的集合,训练集SSS,测试集TTT,正反例按照相同的比例 缺陷:如TTT较小,评估结果会不够准确;如TTT较大,SSS和DDD的差距会变大,被评估的模型原创 2021-06-30 13:16:02 · 279 阅读 · 2 评论