MachineLearning
文章平均质量分 72
Andrewseu
A man in the road---Fighting!
展开
-
【斯坦福---机器学习】复习笔记之生成学习算法
本讲大纲:1.生成学习算法(Generative learning algorithm) 2.高斯判别分析(GDA,Gaussian Discriminant Analysis) 3.朴素贝叶斯(Naive Bayes) 4.拉普拉斯平滑(Laplace smoothing)1.生成学习算法判别学习算法(discriminative learning algorithm):直接学习p(y|x)原创 2015-07-07 14:33:31 · 12733 阅读 · 3 评论 -
SIFT特征
CV界大名鼎鼎的SIFT特征,今天终于要揭开你的面纱!我的学习历程是先看了一些博客,发现并不是很能够理解,跳跃性比较强,没有前因后果,但是Lowe 在04年的那篇论文中详细总结了SIFT特征整个提取流程的思想和原因,因此建议读者可以直接从原文入手,辅以博文以及一些著名大学CV课程的ppt,这样才能深入了解掌握。链接在此http://www.cs.ubc.ca/~lowe/keypoints/介绍原创 2016-06-30 20:09:05 · 1368 阅读 · 1 评论 -
玩转Perceptron Learning Algorithm
数据:https://www.csie.ntu.edu.tw/~htlin/course/ml15fall/hw1/hw1_15_train.dat总共含有400条数据,其中前四个为特征,最后的是label,类别有两类,+1和-1.对这样特征思维,类别两类的分类问题,并且我们已知这些数据是线性可分的,我们采用PLA来进行分类。算法很简单:来源台大林轩田的机器学习基石原创 2016-09-24 13:58:19 · 1869 阅读 · 0 评论 -
机器学习基本概念梳理
1. 什么是机器学习?权威定义:Arthur samuel: 在不直接针对问题进行编程的情况下,赋予计算机学习能力的一个研究领域。Tom Mitchell: 对于某类任务T和性能度量P,如果计算机程序在T上以P衡量的性能随着经验E而自我完善,那么就称这个计算机程序从经验E学习。其实随着学习的深入,慢慢会发现机器学习越来越难定义,因为涉及到的领域很广,应用也很广,现在基本成为原创 2016-12-07 15:46:07 · 13921 阅读 · 0 评论 -
CS231n Assignment2--Fully-connected Neural Network
课程网址:http://cs231n.github.io/assignments2016/assignment2/主要目的是保存一下一个比较完整的全连接神经网络代码,不带说明了,代码说明也比较详细。dataset.py# -*- coding: utf-8 -*-import numpy as npdef unpickle(file): import c原创 2017-02-26 20:39:11 · 2604 阅读 · 0 评论 -
机器学习岗面试点滴聚集
作者:Andrewseu此文将不断更新,谨希望能给正在找实习找工作的同道中人一些参考和帮助!如需转载,请告知!面试技术层面主要分为四块:编程基础,专业知识基础,机器学习理论和实战经验。具体准备方法可以参考:1. 编程基础首先选择一门语言,然后上Leetcode粗暴的刷题,配以《剑指offer》,效果更佳!刷题过程中注意多做总结,先思路,再上代码,事半功倍!2原创 2016-12-30 12:51:17 · 2613 阅读 · 0 评论 -
Generative Adversarial Nets (GAN)解读
会议:NIPS 2014IntroductionGAN,生成对抗式网络是是Ian Goodfellow经典的大作,引起了很大的轰动,后面的各种GAN也层出不穷。追根溯源,为了了解GAN,需要从这篇开山之作说起。那GAN到底是什么?简单来说,GAN由两个模型组成,一个是生成模型G,一个是判别模型D,G负责从给定训练数据中学习数据的概率分布而D负责判别G生成出来的数据是不是符合真实数据原创 2017-06-18 21:10:18 · 1897 阅读 · 1 评论 -
Tensorflow-GPU版本安装(Ubuntu14.04LTS+Cuda8+Quadro K1200)
前言之前装过Caffe,踩过一些坑,现在装Tensorflow相对从容一些,不过还是值得记录一下流程。我的系统配置是:系统:Ubuntu 14.04LTS显卡:Nvidia Quadro K1200CUDA 8.0安装1.安装必要的一些库sudo apt-get install build-essential下载CUDA toolkit 8.0 官网地址友情提示:最好下载本地文件安装.原创 2017-10-07 23:53:26 · 2714 阅读 · 0 评论 -
DCGAN结构解读
DCGAN的原文里面给出的结构如下: 这是G的结构,而D则是完全相反的: 刚看论文的时候觉得结构很清晰,但是实际写代码的时候并不是很能够清楚表示,相信有很多人也是这种感觉,因此这边做一个分析,以便后面的同学理解。这里面涉及到一个名词叫fractionally-strided convolution,与传统的卷积有所区别,这里先做个理解:regular convolution 输入大小为i,s原创 2017-10-13 20:53:05 · 13638 阅读 · 4 评论 -
Nearest Neighbor算法对Cifar-10数据集进行分类
1.preliminaryNearest Neighbor 算法的思想是同一类型的东西总是有一些相似点,在某个空间里是聚集在一起的。比如说对于一直狗和鸡,属于两个不同的物种,鸡有两条腿而都狗有四条腿,狗的叫声是“汪汪”而鸡的叫声是“咯咯”。所以不同的特诊会使鸡和狗聚集在两块不同的区域。一般在现实应用中是不会用1NN的,我们用的更多KNN,至于k的大小是多少,针对不同的问题答案是不一样的,这原创 2016-04-08 22:36:43 · 8970 阅读 · 3 评论 -
图像情感识别
今天组会讲了一个情感图片识别的例子,其实也是一个比较普通的机器学习的过程,但是总体来说涉及到的东西还是很广的,在此再次总结分享一下。问题简单来说就是对图片情感进行分类,分别是Amusement, Anger, Awe, Contentment, Disgust, Excitement, Fear, Sadness八个类。先上整个的流程图:首先我们必须有一个有label的图片数据原创 2016-06-06 21:56:05 · 16669 阅读 · 24 评论 -
图片情感研究现状与思考
图片可以在情感层面上影响人,也能够直接表达人的情感。对于个人来说,图片情感是很主观的,但是人类对于图片的情感认知是有共性的,这也是图片情感识别的基础。现在关于图片情感的研究主要集中在两个方面:图片情感识别、情感图片检索。为了识别图片的情感,需要提取图片的相关特征,建立模型,来填补图片本身与情感之间的情感鸿沟(affective gap)。关于情感特征的提取,也是图片情感领域一直以来的热点问题。情感原创 2016-04-12 18:08:25 · 6983 阅读 · 0 评论 -
【斯坦福---机器学习】复习笔记之欠拟合和过拟合的概念
本讲大纲:1.局部加权线性回归(locally weighted linear regression)给定一个数据集,根据x预测y. 最左边的函数为,并不能很好的拟合数据; 中间的加了一个额外的特性,函数为,稍微更好地拟合了数据; 似乎我们增加越多的特性,拟合程度越好;但是增加太多的特性是很危险的,最右边的图是一个五阶的多项式,虽然很好的拟合了给定的数据集,但是这个并不是一个很好的预测函数原创 2015-07-03 17:45:29 · 7798 阅读 · 0 评论 -
【斯坦福---机器学习】复习笔记之监督学习应用.梯度下降
本讲内容: 1.Linear regression(线性回归) 2.Gradient descent(梯度下降) 3.Normal equation(正规方程组)supervised learning(监督学习):给定一组数据集,告诉算法正确的答案,经过训练,给定输入能够给出正确的输出。开始一个监督学习的例子,房子面积和价格的关系: 给定这样的数据,怎样预测其他房子的价格?引入一些符号:原创 2015-07-02 18:58:46 · 2795 阅读 · 0 评论 -
【斯坦福---机器学习】复习笔记之牛顿方法
本讲大纲:1.牛顿方法(Newton’s method) 2.指数族(Exponential family) 3.广义线性模型(Generalized linear models)1.牛顿方法假设有函数:,我们希望找到满足的值. 这里是实数. 牛顿方法执行下面的更新: 下图为执行牛顿方法的过程: 简单的来说就是通过求当前点的导数得到下一个点.用到的性质是导数值等于该点切线和横轴夹角原创 2015-07-06 16:42:25 · 10953 阅读 · 2 评论 -
【斯坦福---机器学习】复习笔记之朴素贝叶斯算法
本讲大纲:1.朴素贝叶斯(Naive Bayes) 2.神经网络(Neural Networks) 3.支持向量机(Support vector machines)1.朴素贝叶斯前面讲的主要是是二元值的特征,更一般化的是xi可以取{1,2,3…k},这样的话可以用多项式分布代替伯努利分布对p(x|y)进行建模. 即使一些输入特征是连续值,我们也很容易离散化. 就比如说我们xi表示居住面积,我们可原创 2015-07-15 16:58:37 · 5306 阅读 · 0 评论 -
【斯坦福---机器学习】复习笔记之最优间隔分类器
本讲大纲:1.最优间隔分类器(optimal margin classifier) 2.原始/对偶优化问题(KKT)(primal/dual optimization problem) 3.SVM对偶(SVM dual) 4.核方法(kernels)(简要,下一讲详细)1.最优间隔分类器假设给我们的数据集是线性可分的(linearly separable). 就是说用超平面可以分隔正负样本.原创 2015-07-21 20:52:03 · 3447 阅读 · 0 评论 -
【斯坦福---机器学习】复习笔记之顺序最小优化算法
本讲大纲:1.核(kernels) 2.软边界(soft margin) 3.SMO算法(SMO algorithm)1.核属性(attributes):原始的输入值(房价的例子中,x,住房的面积) 特征(features):由原始数据映射的一些数据 用来表示特征映射,例如: 用代替x. 定义核为: 是很容易计算的,即使计算的代价很大(高维向量). 在这种设定中,在算法中用一个很高原创 2015-09-15 11:02:06 · 4208 阅读 · 0 评论 -
【斯坦福---机器学习】复习笔记之经验风险最小化
这一讲开始将是学习理论(Learning Theory)方面的内容.Bias/variance trade-off(偏差-方差权衡) 回到线性回归问题,如图: 泛化误差(generalization error):可能出现的错误并不再已有的数据集中 上图中,左右两幅图的泛化误差都比较大. 左边是欠拟合(underfit)的,即使能够拟合很大一部分数据,但还是可能出现偏差(bias).原创 2015-09-16 16:05:56 · 4009 阅读 · 0 评论 -
【斯坦福---机器学习】复习笔记之特征选择
本讲大纲:1.VC维(VC dimension) 2.模型选择(model selection) —交叉验证(cross validation) —特征选择(feature selection)1.VC维给定猜想类,定义VC维(Vapnik-Chervonenkis dimension),记作VC(H),表示能够被分开的最大集合的尺寸(如果能够分开任意大的集原创 2015-09-18 19:38:27 · 4601 阅读 · 0 评论 -
七步理解深度学习
七步理解深度学习By Matthew Mayo 翻译by Andrewseu深度学习是机器学习的一个分支,拥有很多的相似性,但是却也不同,深度神经网络结构在自然语言处理、计算机视觉、生物信息学和其他领域解决了各种各样的问题。翻译 2016-01-18 17:43:43 · 14755 阅读 · 3 评论 -
CGAN结构详细解读
前言本文适用于对CGAN结构不懂得同学,所谓CGAN,就是conditional Gan,针对GAN本身不可控的缺点,加入监督信息,指导GAN网络进行生成。CGAN结构y就是加入的监督信息,比如说MNIST数据集可以提供数字label信息,人脸生成可以提供性别、是否微笑、年龄等信息;我们具体分析的是InfoGan里面的MNIST生成结构,网络结构如下图: 如果对conv和upconv有不理解的同学原创 2017-10-17 14:38:42 · 24519 阅读 · 11 评论