机器学习
文章平均质量分 76
青竹aaa
这个作者很懒,什么都没留下…
展开
-
交叉验证
本文结构:什么是交叉验证法? 为什么用交叉验证法? 主要有哪些方法?优缺点? 各方法应用举例?什么是交叉验证法?它的基本思想就是将原始数据(dataset)进行分组,一部分做为训练集来训练模型,另一部分做为测试集来评价模型。为什么用交叉验证法?交叉验证用于评估模型的预测性能,尤其是训练好的模型在新数据上的表现,可以在一定程度上减小过拟合。 还可以从有限的数据中获取尽可能多的有效信息。主要有哪些方法?1. 留出法 (holdout cross validation)在机器学转载 2021-01-25 23:00:44 · 283 阅读 · 0 评论 -
指数加权平均(EMA)理解
主要内容 什么是EMA? 为什么EMA在测试过程中使用通常能提升模型表现? Tensorflow实现 PyTorch实现 Refercences 什么是EMA?滑动平均(exponential moving average),或者叫做指数加权平均(exponentially weighted moving average),可以用来估计变量的局部均值,使得变量的更新与一段时间内的历史取值有关。滑动平均可以看作是变量的过去一段时间取值的均值,相比对变量直接赋值而言,滑动.转载 2021-01-24 22:33:57 · 3242 阅读 · 0 评论 -
先验概率、后验概率、贝叶斯公式的通俗解释
记录一下https://www.cnblogs.com/yemanxiaozu/p/7680761.htmlhttps://blog.csdn.net/qq_38906523/article/details/80242170https://blog.csdn.net/venom_snake/article/details/89925155?utm_medium=distribute.pc_relevant.none-task-blog-BlogCommendFromMachineLearnPa.原创 2021-01-18 00:19:00 · 237 阅读 · 0 评论 -
SVM理解与核函数
考研对信息的获取至关重要,此公众号会发表计算机考研(初复试信息)、夏令营等资料,方便考研人对信息的获取,节约自身查找资料的时间目录1. SVM1.1 SVM 基本概念2寻找最大间隔2.1点到超平面的距离公式2.2最大间隔的优化模型2.3松弛变量3.核函数4.相关概念补充4.1线性可区分和线性不可区分4.2对偶问题4.3SVM 可扩展到多分类问题4.4SVM 算法特性1. SVM支持向量机(support vector machines,SVM...原创 2020-10-29 22:21:20 · 1823 阅读 · 0 评论 -
偏差和方差
考研对信息的获取至关重要,此公众号会发表计算机考研(初复试信息)、夏令营等资料,方便考研人对信息的获取,节约自身查找资料的时间当我们费劲周章不断调参来训练模型时,不可避免地会思考一系列问题,模型好坏的评判标准是什么?改善模型的依据何在?何时停止训练为佳? 要解决上述问题,我们需要引入偏差和方差这两个概念,理解他们很重要,也是后续了解过拟合、正则化、提早终止训练、数据增强等概念和方法的前提。目录一、概念定义二、图形定义三、数学定义四、过拟合、欠拟合和恰好五、结论 ...转载 2020-10-23 22:40:33 · 275 阅读 · 0 评论 -
反向传播算法”过程及公式推导
考研对信息的获取至关重要,此公众号会发表计算机考研(初复试信息)、夏令营等资料,方便考研人对信息的获取,节约自身查找资料的时间文章目录 前言 定义 算法讲解(耐心看) CASE 1(图示讲解,看不太懂没关系,看第二组图) CASE 2(具体计算举例,嫌麻烦的可直接看这个,强烈推荐!!!!!) References 前言(扯犊子)这是一场以误差(Error)为主导的反向传播(Back Propagation)运动,旨在得到最优的全局参数矩阵,进而...转载 2020-10-17 12:30:36 · 1089 阅读 · 0 评论 -
《机器学习实战》笔记-----K近邻算法约会软件
考研对信息的获取至关重要,此公众号会发表计算机考研(初复试信息)、夏令营等资料,方便考研人对信息的获取,节约自身查找资料的时间1.KNN算法import numpy as npimport operatordef createDataset(): group=np.array([[1.0,1.1],[1.0,1.0],[0,0],[0,0.1]]); labels = ['A','A','B','B']; return group,labels;#knnde...原创 2020-10-16 00:56:33 · 174 阅读 · 1 评论 -
清华大学计算机学科推荐学术会议和期刊列表
清华大学近期发布了《清华大学计算机学科推荐学术会议和期刊列表》,关于人工智能方面,推荐了12个A类会议,17个B类会议;A类期刊6个,B类期刊33个。根据清华的学术评价规定,原则上,人工智能方向的研究成果发表论文必须要在列表中的会议或期刊才计分,山人感觉这就很有参考价值了,否则漏掉哪个权威会议期刊的话岂不贻笑大方了?下面我们就来看看都是哪些会议期刊值得关注吧!A类会议简介 CVPR CVPR是IEEE Conference on Computer ...转载 2020-10-13 22:20:47 · 5055 阅读 · 0 评论 -
PCA详解
1.相关背景在许多领域的研究与应用中,通常需要对含有多个变量的数据进行观测,收集大量数据后进行分析寻找规律。多变量大数据集无疑会为研究和应用提供丰富的信息,但是也在一定程度上增加了数据采集的工作量。更重要的是在很多情形下,许多变量之间可能存在相关性,从而增加了问题分析的复杂性。如果分别对每个指标进行分析,分析往往是孤立的,不能完全利用数据中的信息,因此盲目减少指标会损失很多有用的信息,从而产生错误的结论。因此需要找到一种合理的方法,在减少需要分析的指标同时,尽量减少原指标包含信息的损失,以达到对所收转载 2020-10-07 17:41:06 · 2105 阅读 · 0 评论 -
线性回归
0 什么是回归?假设线性回归是个黑盒子,那按照程序员的思维来说,这个黑盒子就是个函数,然后呢,我们只要往这个函数传一些参数作为输入,就能得到一个结果作为输出。那回归是什么意思呢?其实说白了,就是这个黑盒子输出的结果是个连续的值。如果输出不是个连续值而是个离散值那就叫分类。那什么叫做连续值呢?非常简单,举个栗子:比如我告诉你我这里有间房子,这间房子有40平,在地铁口,然后你来猜一猜我的房子总共值多少钱?这就是连续值,因为房子可能值80万,也可能值80.2万,也可能值80.111万。再比如,我告诉你我...转载 2020-09-04 23:35:56 · 399 阅读 · 0 评论 -
梯度下降算法
1. 概述梯度下降(gradient descent)在机器学习中应用十分的广泛,不论是在线性回归还是Logistic回归中,它的主要目的是通过迭代找到目标函数的最小值,或者收敛到最小值。本文将从一个下山的场景开始,先提出梯度下降算法的基本思想,进而从数学上解释梯度下降算法的原理,解释为什么要用梯度,最后实现一个简单的梯度下降算法的实例!2. 梯度下降算法2.1 场景假设梯度下降法的基本思想可以类比为一个下山的过程。假设这样一个场景:一个人被困在山上,需要从山上下来(找到山的最低点,也就转载 2020-09-05 09:32:47 · 2486 阅读 · 0 评论 -
西瓜书:假设空间与版本空间。如何求版本空间
假设空间:属性所有可能取值组成的可能的样本版本空间:与已知数据集一致的所有假设的子集集合。在西瓜问题中,如何根据训练集求所对应的版本空间?①写出假设空间:先列出所有可能的样本点(即特征向量)(即每个属性都取到所有的属性值)②对应着给出的已知数据集,将与正样本不一致的(要与数据集中所有的正样本一致,假设有个样本与数据集中一个正样本一致,又与数据集中另一个正样本不一致,还是要删除)、与负样本一致的假设删除。即可得出与训练集一致的假设集合,也就是版本空间了。备注:通配符*可以代表任意一种可转载 2020-09-10 21:38:12 · 2116 阅读 · 0 评论