MAC_基础知识
Qiang__zi
...
展开
-
Scikit-learn Preprocessing 预处理
本文主要是对照scikit-learn的preprocessing章节结合代码简单的回顾下预处理技术的几种方法,主要包括标准化、数据最大最小缩放处理、正则化、特征二值化和数据缺失值处理。内容比较简单,仅供参考!首先来回顾一下下面要用到的基本知识。一、知识回顾均值公式:x¯=1n∑i=1nxi方差公式:s2=1n∑i=1n(xi转载 2017-06-17 23:44:28 · 282 阅读 · 0 评论 -
Caffe源码:blob 分析
目录目录简单介绍源代码分析Reshape 函数Blob 构造函数data_数据操作函数反向传播导数diff_ 操作函数ShareData 函数Updata 函数asum_data 函数asum_diff 函数sumsq_data 函数sumsq_diff函数scale_data 函数scale_diff函数ShapeEquals函转载 2017-10-29 11:11:20 · 274 阅读 · 0 评论 -
最大似然估计 (MLE) 最大后验概率(MAP)
1) 最大似然估计 MLE给定一堆数据,假如我们知道它是从某一种分布中随机取出来的,可是我们并不知道这个分布具体的参,即“模型已定,参数未知”。例如,我们知道这个分布是正态分布,但是不知道均值和方差;或者是二项分布,但是不知道均值。 最大似然估计(MLE,Maximum Likelihood Estimation)就可以用来估计模型的参数。MLE的目标是找出一组参数,使得模型产生出观测数据转载 2017-10-28 21:35:29 · 356 阅读 · 0 评论 -
如何调试Python程序
方法一:当你在有问题的代码前加上这段代码,它就可以帮助你在异常时进入ipdb调试模式。前提是你要安装ipython。import sysfrom IPython.core import ultratbsys.excepthook = ultratb.FormattedTB(mode='Verbose', color_scheme='Linux', call_pdb=1)你原创 2017-10-17 23:28:46 · 382 阅读 · 0 评论 -
python实现卷积层的前向后向传播过程
Convolution Layer Forward卷积层的前向激活过程,我们首先忽略激活层。认为f(x)=x,那么纯卷积层的前向激活公式如下: outn,f,ho,wo=conv(XP,W,b,params) outn,f,ho,wo=conv(XP,W,b,params) =∑c=0,ho=0,wo=0C−1,Ho−1,Wo−1XPn,c,ho∗S+(1:HH),转载 2017-10-17 22:36:48 · 3619 阅读 · 0 评论 -
随机梯度下降的公式实现
一、梯度下降算法理论知识我们给出一组房子面积,卧室数目以及对应房价数据,如何从数据中找到房价y与面积x1和卧室数目x2的关系?为了实现监督学习,我们选择采用自变量x1、x2的线性函数来评估因变量y值,得到:这里,sita1、sita2代表自变量x1、x2的权重(weights),sita0代表偏移量。为了方便,我们将评估值写作h(转载 2017-06-27 11:26:50 · 3534 阅读 · 1 评论 -
BackPropagation(BP, 误差反向传播)的一些理解
在现代神经网络中, 使用最多的算法当是反向传播(BP). 虽然BP有着收敛慢, 容易陷入局部最小等缺陷, 但其易用性, 准确度却是其他算法无可比拟的.在本文中, wjiwji为连接前一层unitiuniti和后一层unitjunitj的权值.在MLP中, 对于输出层神经元unitjunitj, 它的输入xjxj按下式进行计算(忽略偏置):xj=∑iyiwji转载 2017-07-02 10:57:32 · 1556 阅读 · 0 评论 -
工程师必备,最好的九张机器学习&深度学习代码速查表
1.KerasKeras 是一个非常强大且容易上手的深度学习库;当 Keras 接入 Theano 和 TensorFlow 时,后两者可提供高水平的神经网络 API 以开发和评估深度学习模型。该速查表可用于 Python 数据科学和机器学习。2. NumpyNumpy 库是 Python 中科学性计算的核心库,它提供高性能、多维度的数组对象,以及对转载 2017-07-11 10:37:39 · 309 阅读 · 0 评论 -
scikit-learn 主要模块和基本使用方法
引言对于一些开始搞机器学习算法有害怕下手的小朋友,该如何快速入门,这让人挺挣扎的。在从事数据科学的人中,最常用的工具就是R和Python了,每个工具都有其利弊,但是Python在各方面都相对胜出一些,这是因为scikit-learn库实现了很多机器学习算法。加载数据(Data Loading)我们假设输入时一个特征矩阵或者csv文件。首先,数据应该被载入内存中。转载 2017-06-18 09:30:21 · 369 阅读 · 0 评论 -
机器学习样本特征之间的相似性度量总结
在机器学习和数据挖掘中,我们经常需要知道个体间差异的大小,进而评价个体的相似性和类别。最常见的是数据分析中的相关分析,数据挖掘中的分类和聚类算法,如 K 最近邻(KNN)和 K 均值(K-Means)等等。根据数据特性的不同,可以采用不同的度量方法。一般而言,定义一个距离函数 d(x,y), 需要满足下面几个准则:1) d(x,x) = 0 // 到自转载 2017-06-18 00:09:19 · 34359 阅读 · 1 评论 -
cafffe数据层及参数
要运行caffe,需要先创建一个模型(model),如比较常用的Lenet,Alex等, 而一个模型由多个屋(layer)构成,每一屋又由许多参数组成。所有的参数都定义在caffe.proto这个文件中。要熟练使用caffe,最重要的就是学会配置文件(prototxt)的编写。层有很多种类型,比如Data,Convolution,Pooling等,层之间的数据流动是以Blobs的方式进行。转载 2017-11-17 09:20:02 · 508 阅读 · 0 评论