![](https://img-blog.csdnimg.cn/20201014180756923.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
机器学习
果菌药
此人并不懒,但还是什么也没写
展开
-
使用fbpca提取数据主成分(PCA)方向
fbpca 是Facebook 公司开源的 Fast Randomized PCA/SVD 工具(快速随机 PCA/SVD 算法分析)。fbpca由python语言编写,可以方便的用于深度学习的一些工程或者不方便使用MATLAB的工程中。本文主要介绍如何使用该工具分析数据的主成分,而不过多介绍PCA的原理。fbpca在GitHub上的项目地址:https://github.com/facebookarchive/fbpca安装fbpca:pip install fbpca安装依赖...原创 2021-08-27 21:44:36 · 439 阅读 · 0 评论 -
机器学习 复习笔记7 (第七章 贝叶斯分类器)
7.1 贝叶斯决策论(填空)贝叶斯判定准则:为最小化总体风险,只需在每个样本上选择哪个能使条件风险最小的类别标记,即此时,被称为贝叶斯最优分类器,与之对应的总体风险称为贝叶斯风险。先验概率: 类条件概率、“似然”: 后验概率:7.2 极大似然估计关于极大似然估计的概念我在之前的博客中有提到,在复习笔记3,3.4小结的上面,传送门:极大似然法本篇博客结合一个更具体...原创 2019-05-10 17:21:41 · 1861 阅读 · 0 评论 -
机器学习 复习笔记5 (第五章 神经网络)
5.1 神经元模型神经网络的定义:神经网络是由具有适应性的简单单元组成的广泛并行互联的网络,它的组成能够模拟生物神经系统对真实世界物体做出的交互反应。模型结构:MP神经元模型,神经元接收到来自n个其他神经元传递过来的输入信号,这些输入信号通过带权重的连接进行传递,神经元接收到的总输入值将与神经元的阈值进行比较,然后通过“激活函数”处理产生神经元的输出。下图形象地表现了这个模型结构:...原创 2019-05-08 12:16:31 · 1097 阅读 · 0 评论 -
机器学习 复习笔记4 (第四章 决策树)
4.1 基本流程决策过程中提出的每个判定问题都是对某个属性的“测试” 决策过程的最终结论对应了我们所希望的判定结果 每个测试的结果或是导出最终结论,或者导出进一步的判定问题,其考虑范围是在上次决策结果的限定范围之内决策树学习基本算法4.2 划分选择决策树学习的关键在于如何选择最优划分属性。一般而言,随着划分过程不断进行,我们希望决策树的分支节点所包含的样本尽可能属于同一类...原创 2019-05-06 22:23:29 · 741 阅读 · 0 评论 -
机器学习 复习笔记6 (第六章 支持向量机)
本篇博客的开始给大家推荐一篇非常好的介绍支持向量机的博文,这篇博文中对很多细节有详尽的描述传送门:支持向量机通俗导论6.1 间隔与支持向量(填空、问答)超平面方程定义:,其中法向量w决定了超平面的方向,位移项b决定了超平面与原点之间的距离样本空间中任意点到超平面的距离为:若超平面能够将训练样本正确分类,即对于训练集中的样本,若,则有,若,则有令:支持向量:处于边界上的点...原创 2019-05-09 13:10:48 · 1017 阅读 · 0 评论 -
机器学习 复习笔记3 (第三章 线性模型)
3.1 基本形式其中是由属性描述的示例,其中是在第i个属性上的取值,而是每个属性对应的权重。其具有非常好的可解释性。需要能够在多种模型中,辨析出线性模型。3.2 线性回归线性回归的目的:试图学得一个线性模型以尽可能准确地预测实际输出标记。单个参量使用最小二乘法进行线性回归: 由此公式计算出w 再由上式得处的w计算出b 其中是x的均值3.3 对数几率回归对数几...原创 2019-05-05 14:59:38 · 516 阅读 · 0 评论 -
机器学习 复习笔记2 (第二章 模型选择与评估)
2.1 经验误差与过拟合错误率的概念:分类错误的样本占样本总数的比例:E=a/m误差的概念:学习器的实际预测输出与样本真实输出之间的差异称为误差。误差分为三种:训练(经验)误差:学习器在训练集上的误差(实际中只能做到此项上的最小) 测试误差:学习器在测试集上的误差 泛化误差:学习器在新样本上的误差(此项越小则学习器效果越好)过拟合:学习器把训练样本学习得太好,将训练样本本身得特点...原创 2019-05-03 12:40:37 · 845 阅读 · 2 评论 -
机器学习 复习笔记1(第一章 绪论)
1.2 基本术语数据相关概念解释: 一组记录的集合称为一个“数据集”,其中每条记录是关于一个事件或对象的描述,称为一个“示例”或“样本”。反应事件或对象的在某方面的表现或性质的事项,例如“色泽”、“根蒂”、“敲声”,称为“属性”或“特征”;属性上的取值,例如“青绿”、“乌黑”,称为“属性值”。属性张成的空间称为“属性空间”、“样本空间”或“输入空间”。例如我们把“色泽”、“根蒂”、“敲声...原创 2019-05-01 21:51:15 · 553 阅读 · 0 评论 -
关于西瓜书书后习题的思考:机器学习学习笔记二
第2章 模型评估与选择2.1 数据集包含1000个样本,其中500个正例、500个反例,将其划分为包含70%样本的训练集和30%样本的测试集用于留出法评估,试估算共有多少种划分方式。关键概念解释:模型选择(model selection):在现实任务中,我们往往有多种学习算法可以选择,甚至在同一个学习算法,当使用不同的参数配置时也会产生不同的模型,在机器学习中,选择某种学习算法、...原创 2019-03-02 20:32:10 · 1297 阅读 · 0 评论 -
关于西瓜书书后习题的思考:机器学习学习笔记一
第1章 绪论1.1 表1.1中若只包含编号为1和4的两个样例,试给出相应的版本空间。关键概念解释:假设空间:训练集中所有属性的可能性的集合+属性无论取什么情况都合适的集合(即一个或多个属性被“*”替代)+概念不成立的情况(1个空集) 版本空间:与训练集一致的集合。即在假设空间中筛选出和训练集相同的集合。筛选的时候将训练集中每一条数据与假设空间中的数据一一比对,训练集中是正例的只要...原创 2019-03-01 20:32:13 · 427 阅读 · 0 评论