机器学习
文章平均质量分 84
Solomon1588
这个作者很懒,什么都没留下…
展开
-
机器学习相关软件介绍及部署
机器学习之软件部署 1. R语言 1.1 R语言简介R是统计领域广泛使用的诞生于1980年左右的S语言的一个分支。可以认为R是S语言的一种实现。而S语言是由AT&T贝尔实验室开发的一种用来进行数据探索、统计分析和作图的解释型语言。最初S语言的实现版本主要是S-PLUS。S-PLUS是一个商业软件,它基于S语言,并由MathSoft公司的统计科学部进一步完善。原创 2014-10-26 00:29:32 · 1225 阅读 · 0 评论 -
计算机视觉CV领域大牛及研究组主页链接
牛人主页(主页有很多论文代码)Serge Belongie atUC San DiegoAntonioTorralba at MITAlexei Ffros atCMUCe Liu atMicrosoft Research New EnglandVittorioFerrari at Univ.of EdinburghKristenGrauman at UT Austin转载 2016-05-23 21:41:49 · 9150 阅读 · 0 评论 -
图像数据集构建调研报告
数据集是由一组数据组成的集合,用于对提出算法进行训练和测试。在图像领域,针对不同应用,数据集构造不同,体现在规模,图片尺寸等性质上。图像应用主要有检测、分类和分割三大类。本文将介绍数据集的构建以及辅助生成工具。1. 数据集的特点 在物体检测方面,数据集规模适中,图片范围相对较大。自然图像中,以PASCAL VOC2007为例(The 2005 PASCAL Visual Object Cla原创 2016-07-29 23:17:41 · 11767 阅读 · 0 评论 -
数据竞赛综述
数据竞赛综述 随着大数据时代的到来,海量的数据驱动着机器学习的高速发展,构建相应的测试评估体系势在必行。数据建模和分析挑战赛主要由以下几个要素构成: * 数据集:一般包括训练集、验证集和测试集。其中训练集和验证集是公开的,包含原始图像和标注信息(物体的边框坐标、类别标签),分别用于模型训练和模型选择。测试集不对外公布,用于评估算法的精度。 * 开发者工具/文档(可选):辅助参赛者使用数据集原创 2016-07-29 23:33:31 · 1806 阅读 · 0 评论 -
不同学习任务的评价方法
图像识别分析数据集是一个多分类数据集,在预测结果评估过程中与需要注意一些问题[Everingham M]: 1. 在图像分类任务中,仅用一个标签标示样本,而图像中可能包含多个类别的物体。面对这种问题,可以借鉴图像检索的评估思路,使用top @k 模型对模型进行评估,只要前k个标签中有一个正确的,就算分类正确。 2. 每类物体的样本数量分布不均匀,避免使用准确率(accuracy)等对原创 2016-07-29 23:50:15 · 2897 阅读 · 0 评论 -
生成式模型 & 生成对抗网络——资料梳理(专访资料 + 论文分类)
文献整理 题目主要内容 GAN综述【1】 「无中生有」计算机视觉探奇(下) 1. 1)超分辨率重建;2)图像着色;3)看图说话;4)人像复原;5)图像自动生成2. 生成对抗网络博弈论中的零和博弈3. 将GAN用原创 2016-08-27 23:52:50 · 26725 阅读 · 3 评论 -
对抗样本和对抗网络
前言:本文转载lancezhange 的博文《对抗样本和对抗网络》,文章介绍了对抗样本的概念和相关文献,并且进一步介绍了生成式对抗网络(Generative Adversarial Nets, GAN)。 所谓对抗 样本是指将实际样本略加扰动而构造出的合成样本,对该样本,分类器非常容易将其类别判错,这意味着光滑性假设(相似的样本应该以很高的概率被判为同一类别)某种程度上被推翻了。转载 2016-08-29 10:15:29 · 9193 阅读 · 0 评论 -
DeepMind one shot learning 论文批注 One-Shot Generalization in Deep Generative Models
One-Shot Generalization in Deep Generative ModelsDanilo J. RezendeShakir Mohamed Ivo Danihelka Karol Gregor Daan WierstraGoogle DeepMind,London2. Varieties of AttentionSpatially-transformed原创 2016-08-30 15:19:35 · 2590 阅读 · 1 评论 -
深度学习与生成式模型
Main points 阐述生成式模型的求解目标(联合分布),应用方式(判别、生成分布的样本)。 阐释深度学习与生成式模型的关系; 调研深度学习在生成式模型方面的发展,分类阐述(求解方法); 相较于传统生成式模型,深度生成式模型的特点、优势; Outline: 1. 生成式模型的定义[wiki](joint probability distribut原创 2016-09-12 12:49:07 · 16099 阅读 · 0 评论 -
跨平台Caffe及I/O模型与并行方案(三)
3. Caffe I/O模型 Caffe支持GPU加速模式,这种异构程序设计对于I/O模型的效率有更高的要求。Caffe通过引入多重预缓冲来弥补内存与显存带宽的较大差距,使用主存管理自动机控制内存与显存的数据传输与同步,从而达到隐藏传输时间、提高计算资源利用率以及保持数据一致性的目标。Caffe还支持单机多GPU的数据并行,多线程I/O模型为其并行方案提供支持。本章将从原理探究与框架分析原创 2016-08-23 15:40:11 · 4583 阅读 · 0 评论 -
生成式对抗网络GAN研究进展(一)
【前言】 本文首先介绍生成式模型,然后着重梳理生成式模型(Generative Models)中生成对抗网络(Generative Adversarial Network)的研究与发展。作者按照GAN主干论文、GAN应用性论文、GAN相关论文分类整理了45篇近两年的论文,着重梳理了主干论文之间的联系与区别,揭示生成式对抗网络的研究脉络。 涉及的论文有: [1] Goodfe原创 2016-09-14 13:16:15 · 51038 阅读 · 1 评论 -
生成式对抗网络GAN研究进展(二)——原始GAN
【前言】 本文首先介绍生成式模型,然后着重梳理生成式模型(Generative Models)中生成对抗网络(Generative Adversarial Network)的研究与发展。作者按照GAN主干论文、GAN应用性论文、GAN相关论文分类整理了45篇近两年的论文,着重梳理了主干论文之间的联系与区别,揭示生成式对抗网络的研究脉络。 涉及的论文有: [1] Goodfe原创 2016-09-15 12:43:07 · 40801 阅读 · 0 评论 -
生成式对抗网络GAN研究进展(五)——Deep Convolutional Generative Adversarial Nerworks,DCGAN
【前言】 本文首先介绍生成式模型,然后着重梳理生成式模型(Generative Models)中生成对抗网络(Generative Adversarial Network)的研究与发展。作者按照GAN主干论文、GAN应用性论文、GAN相关论文分类整理了45篇近两年的论文,着重梳理了主干论文之间的联系与区别,揭示生成式对抗网络的研究脉络。 本文涉及的论文有: Goo原创 2016-09-18 13:54:32 · 41523 阅读 · 5 评论 -
生成式对抗网络GAN研究进展(三)——条件GAN
【前言】 本文首先介绍生成式模型,然后着重梳理生成式模型(Generative Models)中生成对抗网络(Generative Adversarial Network)的研究与发展。作者按照GAN主干论文、GAN应用性论文、GAN相关论文分类整理了45篇近两年的论文,着重梳理了主干论文之间的联系与区别,揭示生成式对抗网络的研究脉络。 本文涉及的论文有: [1] Good原创 2016-09-16 17:30:09 · 33322 阅读 · 3 评论 -
生成式对抗网络GAN研究进展(四)——Laplacian Pyramid of Adversarial Networks,LAPGAN
【前言】 本文首先介绍生成式模型,然后着重梳理生成式模型(Generative Models)中生成对抗网络(Generative Adversarial Network)的研究与发展。作者按照GAN主干论文、GAN应用性论文、GAN相关论文分类整理了45篇近两年的论文,着重梳理了主干论文之间的联系与区别,揭示生成式对抗网络的研究脉络。 本文涉及的论文有: [1] Good原创 2016-09-17 13:35:34 · 10085 阅读 · 3 评论 -
面向医学图像分析的深度学习研究方案
面向医学图像分析的深度学习研究方案 这是一篇有关“深度学习在医学图像处理方面”的研究报告的第一节,主要包含研究对象,常用方法,深度学习简介,研究现状,研究重点。 在撰写报告时,我找到了两篇 Deep learning for BioInformation / BioMedicine 的综述文章,也一并分享出来: Deep Learning in Bioinformatic Ap原创 2016-05-06 22:13:20 · 16421 阅读 · 4 评论 -
常见的机器学习&数据挖掘知识点
常见的机器学习&数据挖掘知识点Basis(基础):SSE(Sum of Squared Error, 平方误差和)SAE(Sum of Absolute Error, 绝对误差和)SRE(Sum of Relative Error, 相对误差和)MSE(Mean Squared Error, 均方误差)RMSE(Root Mean Squared Error, 均方根误差)RRSE(Ro原创 2016-05-14 19:00:53 · 2635 阅读 · 0 评论 -
Generative Modeling of Convolutional Neural Networks,生成式CNNs
生成式CNNs标签: CNN,Generative Modeling ,Machine Learning, MCMC工作思路 Step 1: 找到切入点,了解生成式模型,及其与CNNs的关系 对照论文原文与PPT内容,了解总体框架; 找到key word,以此为突破点; 生成式模型在CNNs中的应用。 Step2: 阐述生成式模型的背景、物理含义、优缺点,解决问题的一般原创 2016-05-03 23:45:38 · 1351 阅读 · 0 评论 -
用R语言做回归分析_iris数据集/longley数据集
机器学习课程2 回归分析【题目1】使用R对内置鸢尾花数据集iris(在R提示符下输入iris回车可看到内容)进行回归分析,自行选择因变量和自变量,注意Species这个分类变量的处理方法。 解答:iris数据集介绍鸢尾花(iris)是数据挖掘常用到的一个数据集,包含150种鸢尾花的信息,每50种取自三个鸢尾花种之一(setosa,versicolour或virginica原创 2014-11-20 23:20:32 · 50581 阅读 · 4 评论 -
机器学习综述——机器学习理论基础与发展脉络
机器学习研究mailuo 摘要本文主要参考中科院自动化研究所复杂系统与智能科学实验室王珏研究员《关于机器学习的讨论》,讨论机器学习的描述,理论基础,发展历史以及研究现状。关键字:机器学习,科学依据,发展脉络 0引言 20世纪90年代初,当时的美国副总统提出了一个重要的计划——国家信息基本设施计划(NationalInformation Infrastruct原创 2014-11-04 23:29:50 · 13879 阅读 · 4 评论 -
多元线性回归方程建模:使用岭回归与lasso算法选择变量
前言:本文是作者学习机器学习多元线性回归部分,就消除多重共线性、选择变量问题而做的练习。参照了《R-modeling》.薛毅.P331 例6.10例子,使用到R语言的MASS包,ridge包,lars包。原创 2014-12-06 00:11:48 · 15305 阅读 · 1 评论 -
机器学习算法简介
机器学习的算法很多。很多时候困惑人们都是,很多算法是一类算法,而有些算法又是从其他算法中延伸出来的。这里,我们从两个方面来给大家介绍,第一个方面是学习的方式,第二个方面是算法的类似性。学习方式 根据数据类型的不同,对一个问题的建模有不同的方式。在机器学习或者人工智能领域,人们首先会考虑算法的学习方式。在机器学习领域,有几种主要的学习方式。将算法按照学习方式分类是一个不错的想法,这样可转载 2014-12-05 23:19:46 · 1436 阅读 · 0 评论 -
在kyphosis数据集建立支持向量机分类器
1. e1701简介 R语言的e1071包提供了对libsvm的接口。库libsvm包括了常用的核,如线性,多项式,RBF,sigmoid等。多分类通过一对一的投票机制(one-against-one voting scheme)而实现。predict()是训练函数,plot()可视化数据,支持向量,决策边界(如果提供的话)。参数调整tune()。 用e1071包中svm函数原创 2015-03-14 23:49:45 · 3912 阅读 · 2 评论 -
LARS回归算法的几何意义
LARS算法的几何意义 1 LARS算法简介 Efron于2004年发表在Annals of Statistics的文章LEAST ANGLE REGRESSION中提出LARS算法,其核心思想是提出一种新的solution path(求解路径),即在已经入选的变量中,寻找一个新的路径,使得在这个路径上前进时,当前残差与已入选变量的相关系数都是相同的,直到找出新的比当前残差相原创 2014-11-09 18:25:59 · 8899 阅读 · 2 评论 -
OpenCV 2 Mat矩阵的列向量归一化
一、前言: 机器学习算法的数据预处理阶段,归一化是非常重要的一个步骤。例如在应用SVM之前,缩放是非常重要的。Sarle的神经网络FAQ的第二部分(1997)阐述了缩放的重要性,大多数注意事项也适用于SVM。缩放的最主要优点是能够避免大数值区间的属性过分支配了小数值区间的属性。另一个优点能避免计算过程中数值复杂度。因为关键值通常依赖特征向量的内积(inner products),例如,线原创 2015-03-28 20:28:55 · 5256 阅读 · 0 评论 -
CALTECH 101(加利福尼亚理工学院101类图像数据库)
CALTECH 101(加利福尼亚理工学院101类图像数据库)的简介及相关论文链接。翻译 2015-04-11 17:28:44 · 21665 阅读 · 2 评论 -
使用nntool神经网络工具箱建立单层感知器
单层感知器1. 题目要求 使用Matlab的神经网络工具包,建立单层感知器,解决《统计建模与R语言》(薛毅著)电子版第459 页例8.3建立分类器的问题。2. 解题步骤2.1问题分析 符合二值输出:有春旱为1,无春旱为-1。 可以选择激活函数:a=hardlims(n)2.1输入数据>> %predict set>> P =[24原创 2015-06-21 21:41:09 · 4000 阅读 · 0 评论 -
《机器学习系统设计》之数据理解和提炼
前言: 本系列是在作者学习《机器学习系统设计》([美] Willi Richert)过程中的思考与实践,全书通过Python从数据处理,到特征工程,再到模型选择,把机器学习解决问题的过程一一呈现。书中设计的源代码和数据集已上传到我的资源http://download.csdn.net/detail/solomon1558/8971649。 第1章通过一个简单的例子介绍机器原创 2015-08-09 08:34:18 · 3097 阅读 · 2 评论 -
《机器学习系统设计》之k-近邻分类算法
前言: 本系列是在作者学习《机器学习系统设计》([美] WilliRichert)过程中的思考与实践,全书通过Python从数据处理,到特征工程,再到模型选择,把机器学习解决问题的过程一一呈现。书中设计的源代码和数据集已上传到我的资源:http://download.csdn.net/detail/solomon1558/8971649 第2章通过在真实的Seeds数据集原创 2015-08-10 20:14:53 · 3139 阅读 · 2 评论 -
《机器学习系统设计》之应用scikit-learn做文本分类(下)
前言: 本系列是在作者学习《机器学习系统设计》([美] WilliRichert)过程中的思考与实践,全书通过Python从数据处理,到特征工程,再到模型选择,把机器学习解决问题的过程一一呈现。书中设计的源代码和数据集已上传到我的资源:http://download.csdn.net/detail/solomon1558/8971649 第3章通过词袋模型+K均值聚类实现相关文原创 2015-08-15 15:41:55 · 4184 阅读 · 1 评论 -
《机器学习系统设计》之应用scikit-learn做文本分类(上)
前言: 本系列是在作者学习《机器学习系统设计》([美] WilliRichert)过程中的思考与实践,全书通过Python从数据处理,到特征工程,再到模型选择,把机器学习解决问题的过程一一呈现。书中设计的源代码和数据集已上传到我的资源:http://download.csdn.net/detail/solomon1558/8971649 第3章通过词袋模型+K均值聚类实现原创 2015-08-12 22:27:16 · 4290 阅读 · 1 评论 -
使用pip安装numpy库问题汇总
easy_install和pip都是用来下载安装Python一个公共资源库PyPI的相关资源包的管理工具,而pip是easy_install的改进版,提供更好的提示信息,删除package等功能。Python官网上编译好的msi文件已经包含这两个工具,安装在/lib/site-packages文件中。 系统环境是win7(64bit)+python2.7.10(64bit)+vs2010原创 2015-07-17 00:46:47 · 12193 阅读 · 2 评论 -
类间样本数量不平衡对分类模型性能的影响问题
这篇博文是作者的一个实验笔记,研究一个”飞机-背景“二分类器在不同样本比例下精度,召回率的规律。1. 问题描述 固定正样本(飞机)2000个,改变负样本(背景)的训练数据量 1 : 0.5 、 1 : 1 、 1 : 2 、 1 : 5 、 1 : 10 、 1: 30. 随着负样本数量的增多,类间数据量不均衡的情况更为显著。 测试时,分别随机选取4096张飞机、背景样本(不出现在训原创 2016-10-31 22:29:08 · 17493 阅读 · 0 评论