模式识别
文章平均质量分 82
吕刚
模式识别,验证码识别,oa,邮件客户端,无纸化传真
展开
-
nnUnet代码分析一训练
按照上面的提示,我们用的trainer是'nnunet.training.network_training.nnUNetTrainerV2.nnUNetTrainerV2'>一般用法:nnUNet_train 2d nnUNetTrainerV2 TaskXXX_MYTASK FOLD --npz。2d代表2d Unet网络,nnUNetTrainerV2代表trainer,Task是任务id,nnUnet是做分割的一套完整代码,用在医学图像分析中较多,效果还很不错。数据增强也非常简单,只有缩放和旋转。原创 2022-09-02 14:21:10 · 1745 阅读 · 1 评论 -
一个深度学习讲义
一个机器学习讲义,很好。每次看书都是从基础开始看起。可悲啊。不过也慢慢的开始理解了。Notes de cours IFT6266 Hiver 2010http://www.iro.umontreal.ca/~pift6266/H10/notes/mlintro.html原创 2011-09-17 10:46:29 · 2094 阅读 · 0 评论 -
深度神经网络
前2天看到新闻说,用微软用深度神经网络大幅度提高了语言识别的正确率http://research.microsoft.com/en-us/news/features/speechrecognition-082911.aspx于是对深度学习有了兴趣,由于没看过微软的文章,所原创 2011-09-10 19:41:11 · 22015 阅读 · 5 评论 -
python 第3天
今天准备来运行下deep learning 上的几个python的例子。 显示下载theano,直接在cmd里,用easy_intall安装就好了。因为安装python时用的是python(x,y)版本。easy_install意见集成进去了。如果原来spyder打开的原创 2011-09-16 16:47:36 · 2749 阅读 · 0 评论 -
python 第4天,theano
今天看deep learning的例子。读入mnist的时候,出现了memoryerror,怀疑是shell的内存管理问题。后来,我在cmd中python name.py就没有这个问题。在idle中也没有问题。idle的智能提示需要的时间太长了。不知道能设置不?微软的vs也支持python,还是感觉不好用。不知道咋的,一打开vs就很不愉快。vs,matlab这种东西都太庞大了。运行一个原创 2011-10-18 16:33:13 · 17635 阅读 · 0 评论 -
python +numpy,theano,cifar
python里的运算符是根据对象的类型来判断的,如果a,b是list,则a+b是2个list相加,并成一个list,如果要做elementwise的运算,实现a,b里的元素各自相加,则要写代码。于是写了段for 代码,来做,速度实在是慢啊。numpy里提供了numpy.add,numpy.multiply等elementwise 的运算。速度快很多。相同的操作,用python的fo原创 2011-11-13 19:08:17 · 6298 阅读 · 3 评论 -
深度学习--bolzmann machine
bm可以看做是hopfield的一个特例。rbm又是bm的一个特例。下面的代码,看了很久才恍然大悟,好还前面看过bm的理论文章。def sample_h_given_v(self, v0_sample):''' This function infers state of hidden units given visible units ''' # compute the原创 2020-02-24 17:45:34 · 2192 阅读 · 0 评论 -
python +numpy,theano,cifar 2
数据要归一化到[0..1) 貌似dbn还是很普通。cnn提供了共享权值,局部感受野,dbn提供了基于层的学习和非监督学习,模拟了人类的学习,我们可以不知道一个事情是啥,当看多了,以后一点就通了。 有把cnn和dbn结合起来的。 如果把cnn和dbn结合,是在第一层实现cnn,还是每个层都用相同的cnn呢? dbn的各层,是否可用不同的rmb?对于shared原创 2011-11-28 21:19:26 · 4382 阅读 · 0 评论 -
语音识别
siri的出现让语音识别一下子很热门啊。下午有空,找几篇语音识别的论文看看。发现语音识别的研究圈子好像比计算机视觉封闭。 像opencv这样的开源库,以及mnist, pascal voc等很容易找到的研究库,语音识别也一时google不出来。 语音识别的英文翻译:speech recognition另一方面,IBM的viavoice ,微软的语音识别sdk 倒是很容易下载到,原创 2011-12-11 15:12:11 · 5190 阅读 · 0 评论 -
numpy,theano中的函数
theano.tensor.dot(x,y)x,y如果是向量,自动会对y进行转置如果是矩阵,要注意对齐。一般情况下,一个样本应该看做1行n列的向量。tensor.sub(x,y)碰到一个问题,如果x是n行的,y是1行的。要对x中的每行都减去一个y。theano中不知道如何写方便。好像要用循环。就是scan来做。不过scan是对实际的数进行操作的。不是对模型进行定义。而这原创 2011-12-26 16:20:31 · 11605 阅读 · 0 评论 -
ubuntu ,mkl,python, theano
这两天的努力让我明白,开源软件和商业软件是2种不同的文化圈。在windows下使用开源软件的各种痛苦,我是差不多都尝过了。现在也越来越不喜欢打开那个大大的vs。虽然我认为windows还是很优秀的东西。商业软件也是很节省时间的事情。不过。我还是要安装ubuntu了。一半是因为theano吧。因为服务器是winidows 2008的。所以,我得在hyper-v上来安装ubuntu ser原创 2011-12-14 22:28:46 · 4989 阅读 · 0 评论 -
ubuntu扫盲
这几天用了下ubuntu server ,字符界面。从win过来的我,虽然有dos的经验,还是费了点时间。sudo 可以在命令前加sudo,表示超级用户执行。命令可以带路径的。显示当前路径配置$PATH.注意大小写。ubuntu区分大小写的。添加路径 export PATH=你的路径:$PATH,多个路径用:隔开。ls 可以列出当前目录下的文件。 -a可以看到隐藏文件。-原创 2011-12-29 11:06:54 · 951 阅读 · 0 评论 -
hpyer,ubuntu ,theano配置总结---神经网络
用过的神经网络工具里,theano是最好的。theano基于python2.7数据集大,要用theano64位。mingw64环境下。theano64位g++编译不成功。没有mingw64位,theano没法g++编译,速度慢。所以用ubuntu server 64位hpyer-v下安装,最多只支持4个虚拟cpu,电脑性能发挥不出来,不过也凑合用了。ubuntu本身不知道能原创 2011-12-29 10:53:04 · 4060 阅读 · 0 评论 -
卷积神经网络(Lecun的论文)
Lecun的cnn引起了我很大的兴趣,从今天开始看Lecun的论文,并把实践结果发布在这里。20100419 Generalization and Network Design Strategies 论文看完了,搞清楚了里面描述的5中网络结构.BP规则部分的推导,需要看其他的书。以前看的《神经网络设计》中文版中讲的很清楚,当时也看懂了。这两天看下。准备实现这5种网络。20100422原创 2010-04-19 16:32:00 · 10068 阅读 · 1 评论 -
学习笔记--bag of words(4)---内存不够用了
前面运行bag of words的例子碰到了内存不够用,我的内存是2g的,虚拟内存设置了6g,大概系统用了2.5g内存时,在new的时候就出现了badalloc错误,试着在boot。ini 里设置了3gb参数,也没用。 只有试着安装个64位的win7看看。 在查资料的时候意外发现了mpi-ch,貌似可以在局域网内运行并行程序。一定要试试。 http://hi.baidu.com/_00000000/blog/item/a5068e5635d51a153a2935b5.html原创 2011-03-30 14:36:00 · 2590 阅读 · 2 评论 -
学习笔记--bag of words(3)--roc曲线,precision/recall曲线,ap
关于这两个曲线的概念可以看wikihttp://en.wikipedia.org/wiki/ROC_curve rochttp://en.wikipedia.org/wiki/Precision_and_recall precision这里主要涉及如何画这两个曲线。原创 2011-03-25 19:07:00 · 6266 阅读 · 1 评论 -
单神经元感知机代码
这两天在看神经网络设计(中文版),有些地方不是很懂。因此自己动手写代码以加深理解。顺便把代码贴上来,大家一起看看。c#写的。代码中已经有详细解释了。付一个效果图 using System;using System.Collections.Generic;using System.Linq;using System.Text;namespace neuralNetworks{原创 2008-11-28 17:49:00 · 1183 阅读 · 0 评论 -
Hebb规则试验
今天看了下hebb规则,并实现了基本hebb规则的自联想存储器。发现效果不是很理想。只能存储大约4个数字。接下去准备改用仿逆规则来计算权值矩阵W,希望能得到更加好的结果。这之前还得写个矩阵操作的类。(20081212) 用仿逆规则碰到的第一个问题是矩阵求逆算法。根据定义用递归法求的算法复杂度很大。矩阵>10*10计算速度就慢的无法忍受。后来改用了列选主元高斯消去法。速度显著提高。用原创 2008-12-12 10:13:00 · 1894 阅读 · 1 评论 -
支持向量机研究备注
准备开展用支持向量机识别手写数字,字母的研究。用到的手写体数据库是mnist,可以从下面的网页下载。http://yann.lecun.com/exdb/mnist/这里也提到了MNIST数据库的结构。和作者的试验结果。20090522开始看论文a training algorithm for optimal margin classifiers(网络上有的下)原创 2008-12-27 19:22:00 · 568 阅读 · 0 评论 -
序言
最近在看Introduction to Statistical Pattern Recognition ,Fukunaga,Keinosuke[1]2nd Elsevier Academic Press,1999.pdf这个书不错,顺便参试翻译下。 This book presents an introduction to statistical pattern recognition原创 2009-04-09 21:55:00 · 455 阅读 · 0 评论 -
1.1 模式识别问题概述(1)
1.1 Formulation of Pattern Recognition Problems1.1模式识别问题概述Many important applications of pattern recognition can be characterizedas either waveform classification or classification of geometric figu原创 2009-04-10 12:46:00 · 672 阅读 · 0 评论 -
1.2分类器设计流程
1.2 Process of Classifier Design分类器设计流程Figure 1-6 shows a flow chart of how a classifier is designed. After data图1-6显示了一个分类器的设计流程图.is gathered, samples are normalized and registered. Normalization原创 2009-04-10 13:56:00 · 935 阅读 · 0 评论 -
第一章引言
This book presents and discusses the fundamental mathematical tools forstatistical decision-making processes in pattern recognition. It is felt that the本书主要讲述和讨论模式识别中的统计决策处理所需的基本数学工具。decision-making原创 2009-04-09 22:10:00 · 500 阅读 · 0 评论 -
最近发现的几本好书
介绍flash游戏开发的ActionScript3 game programing University 关于模式识别的,Introduction to Statistical Pattern Recognition ,Fukunaga,Keinosuke[1]2nd Elsevier Academic Press,1999.pdf,本来想边看边翻译看。可惜没这么多时间。能够在学校原创 2009-05-19 20:42:00 · 855 阅读 · 0 评论 -
神经网络学习小结
终于答辩通过了,等着拿学位。这几天把2年来看过的知识再整理下。浅薄的很,错误之出大家指出来啊。 几乎是0起点学习,一遍补充数学知识,一边学习新知识。看的书主要是冈萨雷斯的数字图像处理,模式识别的书没系统的看过,后来看的就是戴葵翻译的神经网络设计,支持向量机看了点时间,没看懂。另外也用了下matlab,opencv,不过真正的算法实现还是自己用c#写的,当时是为了更好的理解这些算法。不过因原创 2009-12-30 09:58:00 · 1836 阅读 · 0 评论 -
opencv中的机器学习
主要内容翻译自learning opencv 2.0 机器学习的目的是把数据转换成信息。。。。通过从数据从提取规则或模式做到。这个过程叫做学习 如果数据是已标记的叫监督学习,如果未标记叫做无监督学习。 如果用一个名称来标记数据,我们要做的是分类。如果用一个数值来标记数据,我们要做的是回归。 Supervised learning also comes in shades原创 2009-12-31 08:48:00 · 9230 阅读 · 3 评论 -
学习笔记--bag of words(1)-kMeansCluster
opencv2.2中有很多新方法的例子,里面的bagOfWords 例子给出了使用pascal voc库的详细例子。原创 2011-03-07 17:47:00 · 10133 阅读 · 4 评论 -
学习笔记--bag of words(2)--svm
2011.3.25 bag of words中结果的图形化以及用训练结果做测试。先来看看opencv2.2中svm的使用,还是以(1)中的例子来看。原创 2011-03-23 21:19:00 · 5147 阅读 · 2 评论 -
神经网络设计 摘要
判定边界 判定边界由那些使净输入为0的输入向量确定n=wp+b=0, 一个双输入感知器网络,如果取权值为[1,1],则有p1+p2+b=0,其中p=[p1 p2],这是p1,p2平面上的一条直线.该直线和权值向量w=[1,1]垂直. 感知器学习规则:(P42)1.如果t=1,a=0 则w_new=w_old+p2.如果t=0,a=1 则w_new=w_old-p1.如原创 2008-09-09 13:11:00 · 873 阅读 · 0 评论