caffe代码导读 (1)Caffe源码阅读路线图应该是从CAFFE_ROOT/src/caffe/proto/caffe.proto开始,了解各类数据结构,主要是内存对象和序列化磁盘文件的一一对应关系,知道如何从磁盘Load一个对象到内存,以及如何将内存对象Save到磁盘,中间的过程实现都是由Protobuf自动完成的。(2)第二步就是看头文件,不用急于去看cpp文件,先理解整个框架。Caffe中类数目众多
理解CNN-2 http://blog.csdn.net/zouxy09/article/details/9993371在反向传播中:用得它向量,等于后一层的灵敏度得它乘以函数的导数乘以权重,得到本层的灵敏度对于最后的输出层神经元,就是函数导数乘以误差。本质就是求出对应误差的灵敏感应度。误差对于该层权重的偏导等于该层的输入乘以该层灵敏度。更新权值就是该偏导数乘以一个负学习率理解这些对于理解
softmax分类器 http://ufldl.stanford.edu/wiki/index.php/Softmax%E5%9B%9E%E5%BD%92softmax解决多分类问题假设函数假设函数用来求出概率值时的对应参数代价函数第i个X生产的Y是J类的概率的对数值乘以示例函数包装的第i个Y是j的值,求总和,除以个数,求负示性函数1{*}*为判断条件,真为1,假为0凸函数在
如何理解卷积、权值共享、池化 要理解卷积,首先你要理解什么是全连接和局部连接,全连接是什么?举个例子,100*100大小的图像,假设有100个隐含神经元,那么就有100*100*100个连接,太可怕,局部连接是什么,假设每个隐含神经元只局部连接10*10,那么就有10*10*100个连接。那么什么是卷积,什么又是权值共享?说道权值共享,就需要提到感受野,感受野其实就是一个隐含神经元的局部连接大小,权值共享就是感受野
理解CNN-1 卷积神经网络是人工神经网络的一种,已成为当前语音分析和图像识别领域的研究热点。它的权值共享网络结构使之更类似于生物神经网络,降低了网络模型的复杂度,减少了权值的数量。该优点在网络的输入是多维图像时表现的更为明显,使图像可以直接作为网络的输入,避免了传统识别算法中复杂的特征提取和数据重建过程。卷积网络是为识别二维形状而特殊设计的一个多层感知器,这种网络结构对平移、比例缩放、倾斜或者共他形式的变形具有
深度学习入门-1 点击打开链接以上链接是一系列讲的特别好的深度学习的博客。四、关于特征 4.1、特征表示的粒度 4.2、初级(浅层)特征表示 4.3、结构性特征表示 4.4、需要有多少个特征?五、Deep Learning的基本思想六、浅层学习(Shallow Learning)和深度学习(Deep
深入理解java序列化 Java 串行化技术可以使你将一个对象的状态写入一个Byte 流里,并且可以从其它地方把该Byte 流里的数据读出来,重新构造一个相同的对象。这种机制允许你将对象通过网络进行传播,并可以随时把对象持久化到数据库、文件等系统里。Java的串行化机制是RMI、EJB等技术的技术基础。用途:利用对象的串行化实现保存应用程序的当前工作状态,下次再启动的时候将自动地恢复到上次执行的状态。序列化就是一种用
深入理解JVM -----阿里三面让我有些遗憾,却也给我一定的警示,是的,好好coding java,好好学习数据结构和算法,好好学习机器学习和Hadoop。-----学习java,那一定要好好深入的理解jvm,因为这是核心,也是最重要的东西。从最基本的来说,java源代码和jvm的运行流程:1、java语言被java编译器编译成.class文件,即与平台无关的二进制文件,然后通过就需
java反射机制及性能优化问题 Java 语言的反射机制在Java运行时环境中,对于任意一个类,可以知道这个类有哪些属性和方法。对于任意一个对象,可以调用它的任意一个方法。这种动态获取类的信息以及动态调用对象的方法的功能来自于Java 语言的反射(Reflection)机制。Java中,反射是一种强大的工具。它使您能够创建灵活的代码,这些代码可以在运行时装配,无需在组件之间进行源代表链接。反射允许我们在编
java-经典MVC框架Structs MVC 架构的核心思想是:将程序分成相对独立,而又能协同工作的三个部分。通过使用MVC 架构,可以降低模块之间的搞合,提供应用的可扩展性。下面结合该图对Struts 架构的工作原理简单介绍。1. Model 部分Struts 的Model 部分由ActionForm和lavaBean 组成。其中ActionForm用于封装用户请求参数,所有的用户请求参数由系统自动封
MySQL学习笔记1 常用指令分类:ddl:CREATE、DROP、ALTER (data manipulation)数据定义dml:INSERT、SELECT、UPDATE、DELETE 数据控制,实现查询最优化dcl:控制数据库操纵事务发生的时间及效果,对数据库实行监视等COMMIT、ROLLBACKMySQl结构:MySQL LAY、storage engneer LAY.存
java 网络编程学习笔记 -1 1、将数据发送给那个进程靠端口决定。2、端口范围0-65535.21为FTP,25为SMTP,80为HTTP,125为RPC(远程过程调用)3、TCP、UDP取值独立,允许存在取值相同的TCP、UDP端口。4、java中3种套接字:java.net.Socket,java.net.ServerSocket(TCP)java.DatagramSocket(UDP)c/s模式。
关于Vertebi算法的理解以及程序实现 HMM解码问题 给定一个观察序列O=O1O2...OT,和模型μ=(A,B,π),如何快速有效地选择在一定意义下“最优”的状态序列Q=q1q2...qT,使该状态最好地解释观察序列。 一种想法是求出每个状态的概率rt(i)最大(rt(i)=P(qt=si,O|μ)),记q't(i)=argQmax(rt(i)),但是这样做,忽略了状态之间的关
关于统计语言模型N-gram的理解及sirlm的使用 srilm安装及ngram-count简单使用分类: 语音识别/理解2013-02-05 18:15 2278人阅读 评论(1) 收藏 举报SRILM是一个统计和分析语言模型的工具,提供一些命令行工具,如ngram,ngram-count,可以很方便的统计NGRAM的语言模型。1,下载我开始在这个站上下载,感觉很慢。 http://www.speech.sri.co
最大熵理论及其应用 一、熵物理学概念宏观上:热力学定律——体系的熵变等于可逆过程吸收或耗散的热量除以它的绝对温度(克劳修斯,1865)微观上:熵是大量微观粒子的位置和速度的分布概率的函数,是描述系统中大量微观粒子的无序性的宏观参数(波尔兹曼,1872)结论:熵是描述事物无序性的参数,熵越大则无序。二、熵在自然界的变化规律——熵增原理一个孤立系统的熵,自发性地趋于极大,随着熵的增
使用installanywhere打包java文件生成任何平台都可以运行的程序(如.exe)(关闭360!) InstallAnywhere使用与下载 (2011-07-05 18:30:36)转载▼标签: install anywhere 安装文件 安装目录 软件解决方案 安装包 it分类: Java/J2EEInstallAny
java学习(给对象制作的简单的有背景音乐的电子相册) package com.wx2015210;import java.applet.Applet;import java.awt.BorderLayout;import java.awt.CardLayout;import java.awt.Color;import java.awt.Component;import java.awt.Cursor;import
Android面试和Java面试总结 参加的Android面试:Android四大组件:Activity:Android 中,Activity 是所有程序的根本,所有程序的流程都运行在Activity 之中,Activity可以算是开发者遇到的最频繁,也是Android 当中最基本的模块之一。在Android的程序当中,Activity 一般代表手机屏幕的一屏。如果把手机比作一个浏览器,那么Activity就相当于
中断和查询的差异 java学习4之集合类 中断方式和查询方式,也叫轮询方式,有什么区别,就要知道 什么是中断方式,什么是轮询 方式. 中断的汉语解释是半中间发生阻隔、停顿或故障而断开。那么,在计算机系统中,我们为 什么需要“阻隔、停顿和断开”呢? 举个日常生活中的例子,比如说我正在厨房用煤气烧一壶水,这样就只能守在厨房里,苦 苦等着水开——如果水溢出来浇灭了煤气,有可能就要发生一场灾难了。等啊等啊,外边 突然传来了惊奇的叫声“怎么不关
Java学习3 对于java中的初阶学习,比较难理解的大概有:封装、继承、多态封装比较他、容易理解,继承的话多熟练使用注意一点就是继承只能多层继承,不能多重继承。理解起来其实也很简单,就是一个人不能有几个爸爸,但是可以有爸爸、爷爷等。那么还要提到方法重载和覆写:它们都是“多态”的技术之一。重载,就是方法名称相同,但却可在不同场合做不同的事情。而覆写,则是当一个子类继承一个父类,而子类中的方法与父类中的方法