西瓜书
qq_41629976
这个作者很懒,什么都没留下…
展开
-
周志华西瓜书-第一天阅读-评估方法
2.2评估方法 在训练好模型后我们需要进行验证,这时候需要我们在分割数据时进行一些处理,在这记录一下书中的几个方法。 留出法: 将数据集D 划分为两个互斥的集合,其中一个集合作为训练集S,另一个作为测试集T。在S 上训 练出模型后,用T 来评估其测试误差,作为对泛化误差的估计。但在划分数据集时需要注意三个点: 1.分布:训练/测试集的划分要尽可能保持数据分布的一致性,避免因数据划分过程引入额外的偏...原创 2019-08-30 16:28:38 · 284 阅读 · 1 评论 -
周志华西瓜书-第二天阅读-模型评估
谈一谈混淆矩阵、ROC、AUC的理解原创 2019-08-30 21:29:35 · 164 阅读 · 0 评论 -
周志华西瓜书-第三天阅读-多分类学习
谈一谈多分类学习 很多问题可以可以分为两个类别,称为二分类问题。但有时我们需要分的类不止两个,这时候我们就需要涉及到多分类问题了。今天我就谈一谈多分类学习的基本策略。 二分类直接推广 有些多分类问题可以直接由二分类推广,比如说在线性回归的基础上加上对数几率函数构造二分类模型,我们只需要将分类函数进一步替换即可在线性回归的基础上构造多分类模型。 拆分策略 不失一般性,考虑N 个类别,多分类学习的基本...原创 2019-08-31 13:20:12 · 374 阅读 · 0 评论 -
周志华西瓜书-第四天阅读-类别不平衡问题
类别不平衡 (class-imbalance)就是指分类任务中不同类别的训练样例数目差别很大的情况。不失一般性,本节假定正类样例较少,反类样例较多.在现实的分类学习任务中,我们经常会遇到类别不平衡,例如在通过拆分法解决多分类问题时,即使原始问题中不同类别的训练样例数目相当, 在使用OvR 、MvM策略后产生的二分类任务仍可能出现类别不平衡现象,因此有必要了解类别不平衡性处理的基本方法. 解决思路 ...原创 2019-08-31 14:46:57 · 436 阅读 · 0 评论 -
周志华西瓜书-第五天阅读-神经网络初涉
今天记录三个小细节–梯度下降、学习率以及BP神经网络防止过拟合的方法 梯度下降 学习率 BP神经网络过拟合的处理原创 2019-09-01 17:05:08 · 433 阅读 · 0 评论 -
周志华西瓜书-第六天阅读-从核函数谈SVM
SVM(Support Vector Machine),译为支持向量机。其基本思路是从训练集原创 2019-09-02 17:57:38 · 378 阅读 · 0 评论 -
周志华西瓜书-第七天阅读-初识集成学习
基本概念 集成学习(ensemble learning)通过构建并结合多个学习器来完成学习任务,有时也被称为多分类器系统(multi-classifier system) 、基于委员会的学习(committee-based learning) 等.图8.1 显示出集成学习的一般结构:先产生一组"个体学习器" (individual learner) ,再用某种策略将它们结合起来.个体学习器通常由一...原创 2019-09-03 14:16:52 · 235 阅读 · 0 评论 -
周志华西瓜书-第八天阅读-聚类
什么是聚类 聚类试图将数据集中的样本划分为若干个通常是不相交的子集,每个子集称为一个"簇" (cluster). 通过这样的划分,每个簇可能对应于一些潜在的概念(类别) ,如"浅色瓜" “深色瓜”,“有籽瓜” “无籽瓜”,甚至"本地瓜""外地瓜"等;需说明的是,这些概念对聚类算法而言事先是未知的,聚类过程仅能自动形成簇结构,簇所对应的概念语义需由使用者来把握和命名.可见,聚类是一种无监督学习。 ...原创 2019-09-04 15:08:49 · 171 阅读 · 0 评论