机器学习
文章平均质量分 63
Magic--Rain
这个作者很懒,什么都没留下…
展开
-
机器学习(1):独立同分布IID(independent and identically distributed)
1.独立同分布independent and identically distributed (i.i.d.) 在概率统计理论中,如果变量序列或者其他随机变量有相同的概率分布,并且互相独立,那么这些随机变量是独立同分布。 在西瓜书中解释是:输入空间中的所有样本服从一个隐含未知的分布,训练数据所有样本都是独立地从这个分布上采样而得。 2.简单解释独立、同分布、独立同分布(...原创 2018-10-07 10:39:23 · 30888 阅读 · 1 评论 -
深度学习(2):ImageNet top-1和top-5错误率
1.ImageNetImageNet 项目是一个用于物体对象识别检索大型视觉数据库。截止2016年,ImageNet 已经对超过一千万个图像的url进行手动注释,标记图像的类别。在至少一百万张图像中还提供了边界框。ImageNet 举办一年一度的软件竞赛,叫做 ImageNet 大尺度视觉识别挑战(ImageNet Large Scale Visual Recognition Challeng...原创 2018-11-24 15:12:09 · 5147 阅读 · 1 评论 -
机器学习(3):信息检索指标-查准率(Precision),查全率(Recall),平均准确率(mAP)
一.查准率和查全率查准率=准确率(Precision)=检索到的该类图像/检索到的所有图像数 查全率=召回率(Recall)=检索到的该类图像/数据库中所有的该类图像 二.MAP(Mean Average Precision)平均精度均值MAP可以由它的三个部分来理解:P,AP,MAPP(Precision)精度,正确率。在信息检索领域用的比较多,和正确率一块出现的是...原创 2018-11-26 16:58:04 · 4209 阅读 · 0 评论 -
机器学习(2):训练集,验证集和测试集介绍和交叉验证法介绍
训练集、验证集和测试集这三个名词在机器学习领域极其常见,但很多人并不是特别清楚,尤其是后两个经常被人混用。在有监督(supervise)的机器学习中,数据集常被分成2~3个,即:训练集(train set),验证集(validation set),测试集(test set)。Ripley, B.D(1996)在他的经典专著Pattern Recognition and Neural N...转载 2018-12-13 17:21:53 · 818 阅读 · 0 评论 -
深度学习(1):深度学习常用数据集介绍
各领域公开数据集下载 1.Mnist 手写字体数据集官方数据集下载MNIST数据集简介转载戳这里MNIST(Mixed National Institute of Standards and Technology database)是一个计算机视觉数据集,它包含70000张手写数字的灰度图片,其中每一张图片包含 28 X 28 个像素点。可以用一个数字数组来表示这张图片:每...原创 2018-12-12 10:45:53 · 4127 阅读 · 3 评论 -
机器学习(4):机器学习中的范数规则化之L0、L1与L2范数
今天我们聊聊机器学习中出现的非常频繁的问题:过拟合与规则化。我们先简单的来理解下常用的L0、L1、L2和核范数规则化。最后聊下规则化项参数的选择问题。这里因为篇幅比较庞大,为了不吓到大家,我将这个五个部分分成两篇博文。知识有限,以下都是我一些浅显的看法,如果理解存在错误,希望大家不吝指正。谢谢。 监督机器学习问题无非就是“minimizeyour error while re...转载 2019-01-17 16:30:43 · 354 阅读 · 0 评论 -
机器学习(5):核范数与规则项参数选择
三、核范数 核范数||W||*是指矩阵奇异值的和,英文称呼叫Nuclear Norm。这个相对于上面火热的L1和L2来说,可能大家就会陌生点。那它是干嘛用的呢?霸气登场:约束Low-Rank(低秩)。OK,OK,那我们得知道Low-Rank是啥?用来干啥的? 我们先来回忆下线性代数里面“秩”到底是啥?举个简单的例子吧: 对上面的线性方程组,第一个...原创 2019-01-18 10:19:22 · 396 阅读 · 0 评论