- 博客(40)
- 资源 (8)
- 收藏
- 关注
原创 我认了
老公说,做算法不赚钱。其实,我认了。我是半路出家的,没学过自动化,没学过控制,也没学过离散数学,八竿子打不着的专业转来学习机器学习、模式识别的,我发现我很喜欢现在的专业和工作内容。所以,我想继续做下去,而是否能赚钱,是否累,这些都已经是次要的了。 不适合做工程,因为我不懂DSP;不适合做coder,因为我没有经过专业的coding培训;因此,我想我适合做算法,因为我喜欢。赚钱多少,
2010-05-26 17:01:00 581
原创 latex浮动图形
因为我word用的不好,再者我的文章公式一大堆,虽然俺不是数学专业的。所以,我写文章,尽量用LaTeX,用Word排版我总过不了关。现在发现LaTeX其实排版是非常方便的,或者说你不用排版。只要把一些宏包和命令包含进去,哪些公式啊,图形啊,等等都由LaTeX自己排版完成,版本排完后,非常漂亮。浮动图形的排版,让我开始大伤脑筋,后来看了http://www.ctex.org/document
2010-05-26 16:57:00 1818
原创 转来latex常用设置
1. 段首缩进 中文习惯在段首缩进两格,在LaTeX中,/parindent 表示段首缩进的长度,我们将它设置为当前字号的两个大写字母M的宽度,大约正好是两个汉字的宽度:/setlength{/parindent}{2em}LaTeX 默认每节的第一段的段首不缩进,这不符合中文排版习惯。我们希望正文的每一段都要缩进,使用indentfirst宏包就可办到:/usepackage{
2010-05-25 16:29:00 2583
原创 be desperate for sth
be sufficiently desperate for sth急切需要sthThe company is sufficiently desperate for employees.They are desperate for money, and I am too. I wish companies were desperate for employees in this year.
2010-05-23 10:25:00 3184
原创 管理
以前我总是觉得自己不想管人,当然也不想被人管的死死的。因为我觉得管人很麻烦,而且人其实很难管的,相对来说,我觉得管理计算机和数字或者codes更加容易些。因此,我和老公一起,我连他都不管,他的钱财啥的,我也不管,我嫌麻烦。 可现在我发现,如果不想管人,能让自己过得去的前提是,有个会管理的老板。如果你遇到了一个不会管理的老板,你会被整的一头雾水,整天就闹内部矛盾了。 这不,我们组就是
2010-05-20 17:39:00 622
原创 latex的插图中英文双标注
有很多中文期刊,都要求中英文标注的。于是,查了一下资料,发现方法还是挺好使的。 /bicaption{图}{中文}{Fig}{English title}当然这个需要包含宏包/usepackage{ccaption}。 其中有两种方式,一种方式是将图的序号减去1操作。这个我看到作者说不太好用。建议用上面的这个。其中作者给出的建议,链接http://www.sciencenet.
2010-05-20 11:36:00 14131 2
原创 what energy function can be minimized by graph cuts
rt.一篇04年的PAMI文章,回答了什么样的energy function可以通过graph cuts实现最小化。典型的应用如马尔科夫随机场,条件随机场等。最近在关注相关方向的东东,初级学习阶段,或许这篇文章能对我后续的理解有些帮助。 其实,energy function还有graph cuts,or graph factor都是比较新且比较直观的一些应用吧,但是感觉到最小化实现,再到参
2010-05-19 22:17:00 1923 2
原创 计算机读书推荐
来自北邮论坛数据结构部分修改于2010年1月30日 程序语言部分修改于2010年3月18日 本科不是念计算机的,师弟链接了大牛amiao版内开的书目,感觉太多了,对于不是计算机科班出身的人来说,是很难看完那么多的。仔细删减了再删减,列一下我觉得的计算机软件学科至少应该过一遍的8本,只涵盖“程序语言(C & C++)”、“数据结构”、“操作系统”、“计算机网络”和“计算机系统”五个主题,其他的诸如
2010-05-06 21:22:00 1060 1
原创 bp
zz from lin dahua s msn blog今天先说说belief propagation吧。这是machine learning的泰斗J. Pearl的最重要的贡献。对于统计学来说,它最重要的意义就是在于提出了一种很有效的求解条件边缘概率(conditional marginal probability)的方法。说的有点晦涩了,其实所谓求解条件边缘概率,通俗地说,就是已
2010-05-06 19:35:00 529
原创 学习之感慨
看了Dahua Lin的MSN博客,深受启发。其对数学的理解,感觉真的做到了深入浅出,总是能把深奥的数学知识用比较直观、更贴近应用的方式总结出来,在我眼里,这是学到了精华。 佩服其学识和sharing的精神,同时,也深刻检讨自己,学习不够踏实,尤其是对数学理论的学习。将其最近的一期,推荐书目摘录过来,贴到下面。 Book List Updated这个Blog上的数学书单已经
2010-05-06 15:35:00 804
原创 变分原理
摘自:beal ph.d thesis variational algorithms for approximate bayesian inference The key to the variational method is to approximate the integral with a simpler form that is tractable, forming a lower
2010-05-05 17:15:00 2172
原创 变分
将一个复杂的难以求解的联合概率分解为几个容易求解的概率分布的成绩,使得概率分布的成绩逼近联合概率。为了保证逼近联合概率,取使得联合概率和几个概率分布的熵最小的时候为最优值。
2010-05-05 17:15:00 753
原创 erase
转自疯子空间 2.使用STL中通用算法或容器成员函数删除元素的方法以上手工编写for循环代码删除容器中元素的方法也有一些问题,如果判断条件特别复杂,又有循环判断的话,循环中间又有异常处理的话,++itVect的位置就要小心放置了,稍不留意就要出错。所以手工编写代码删除容器中元素的方法不太安全,代码重复,也不够优雅,要注意的地方很多。对于这种情况,可以考虑使用STL中通用算法remvoe()
2010-05-05 17:13:00 592
原创 remove
在使用stl中的函数remove时,注意,此时remove来自stl中,而不是系统文件删除函数的remove。因此,此时使用remove前,需要包含头文件 #include如果不包含头文件的话,会报错:remove : function does not take 3 parameters。
2010-05-05 17:12:00 626
原创 remove 3
不管它背后藏有多好的原则, std::remove 的行为都让我感到十分惊讶, 这个算法的设计根本是对"最小惊讶原则"的背离, 调用这个方法之后, 原始的元素个数竟然不变. 如果仅有一个被删除元素且是最后一个元素, 则整个容器的表现看上去根本没受任何影响, 如下: vector vec; double_pair dp ; dp = make_pair(1.1, 3.2) ; v
2010-05-05 17:12:00 571
原创 顺序容器中remove
紧接着上面几个转载的内容来写。只是这次写的是自己的使用。由于stl中的remove函数是algorithm中的一个,因此在使用remove之前必须将该头文件库包含进来。在remove中有三个参数,第一个第二个分别是要操作的指针范围,第三个参数是元素内容。template class ForwardIterator, class T > ForwardIterator remove
2010-05-05 17:11:00 660
原创 数学之美
吴军的《数学之美》系列数学之美 一 统计语言模型 数学之美 二 谈谈中文分词 数学之美 三 隐含马尔科夫模型在语言处理中的应用 数学之美 四 怎样度量信息? 数学之美 五 简单之美:布尔代数和搜索引擎的索引 数学之美 六 图论和网络爬虫(Web Crawlers) 数学之美 七 信息论在信息处理中的应用 数学之美 八 贾里尼克的故事和现代语言处理 数
2010-05-05 17:08:00 1050
原创 堆和栈
深刻剖析经典面试题之一:堆和栈的区别转自一个博客堆(heap)和栈(stack)的区别一、预备知识—程序的内存分配一个由c/C++编译的程序占用的内存分为以下几个部分1、栈区(stack)—由编译器自动分配释放,存放函数的参数值,局部变量的值等。其操作方式类似于数据结构中的栈。2、堆区(heap)—一般由程序员分配释放,若程序员不释放,程序结束时可能由OS回收。注意它与数据结构中的堆是
2010-05-05 17:05:00 562
原创 dirichlet分布
in the blog of Jurgen Van Gael, he gave some detail review of dirichlet distribution.http://undirectedgrad.blogspot.com/search/label/iHMMAs in China, we can not visit the blogspot easily, and it is
2010-05-05 17:04:00 2382
原创 gibbs取样
原来一直在看的一个取样算法,我就觉得很奇怪,为何不同的人写的不一样呢。现在明白了,这三种形式不同的地方和为何不同。在文献/cite{Neal2000}中,作者对狄里克雷混合模型的gibbs取样算法进行了综述性介绍。其中前三种算法是处理共轭分布的取样算法。但是,作者并没有详细给出算法的应用举例,在/cite{Ananth2004,Ananth2008,Sudderth2006}中分别对/cite{N
2010-05-05 17:03:00 3350
原创 latex常用技巧
一些Latex小技巧关键词: 一些可能有用的Latex小技巧 1 Q: /begin{eqnarray} T&=&/int_{U}/nabla g(x)/nabla g^T(x) dx // &=&/int_{-/infty}^{/infty}h(x-x_0)/nabla g(x)/nabla g^T
2010-05-05 17:01:00 4308
原创 latex argmax argmin
latex中,用argmax,argmin时,会有上下标的问题。需要特殊设置,这个和普通的上下标不一样。 /begin{equation} C = /mathop{/argmax}_{c}{/sum_t{w^t_c}}%find how to write down the scripts. /end{equation}这样子,上下标就在正下方了。 PS.删东西时一定要看清楚
2010-05-05 17:01:00 11691 1
原创 数据处理
matlab好久不用,又忘的挺干净的了。用c生成的数据中,matlab处理时,如果想画bar图。只需要把数据拷贝到matlab的excel格式文件中,而后选中该列的数据,右键点击,而后就可以看到有个bar和其它画图的命令了。 今天初步验证了我用C写的生成dir分布的随机样本。这一步是没有错的。那么我的程序的结果和YWT的结果相差的原因在哪里呢?继续寻找。看看其它地方是否有错。
2010-05-05 16:59:00 458
原创 matlab绘图
in matlab we can use the command to plot sth. bar 有点类似于histogram的样子,但是,只是画出此点处变量的值,并用一个竖条表示大小。histogram当然是直方图的意思,这个和图像处理中直方图的意义类似。plot主要是将不同的值连接起来,绘制出由这些点形成的函数分布曲线。
2010-05-05 16:59:00 645
原创 算法推荐
有位网友推荐了关于几个算法的notes,记录一下,可能过几天真要具体用到这些算法,说不定可以回头再认真阅读,以供参考。http://hi.baidu.com/flyer_hit/blog/item/5f1c23ddd3862f3c5882dd6f.html摘自这里。其中有EM,KL,PLSA三种算法模型的notes。这三种算法的notes均是牛人ChengXiang Zhai 在其课程
2010-05-05 16:57:00 690 1
原创 随机数生成
用VC6.0产生随机数,真是不可靠。我发现循环的时候,很多时候只是出现同一个数。要说是随机数,感觉随机性太小了。总是出现同一个数,太差劲了。太没随机性了。
2010-05-05 16:55:00 395
原创 数据类型不同
今天犯了个错误,debug时,发现一个地方总是出现无穷大,前面几步都对,到最后一步错了。仔细查看,发现最后一步,因为浮点数起到主要作用了。而其它的数零,因此这时候主要是浮点数的作用,但是加起来却等于零。查了两遍,发现原来是左边是整数型变量,右边浮点型变量由于小于1因此,被整数截取为0了。哎,所以总是得到0,最后总是得到无穷大。因为程序中变量比较多,而且整型和浮点型在计算中相互乘积加减等。需要从
2010-05-05 16:55:00 449
原创 C++static使用
字号:<span id="btnBigFont" style="cursor: pointer; font-weight: normal;" onclick="function onclick(){changeFont(1);}">大 <span id="btnNormalFont" style="cursor: default; font-weight: bold;" oncl
2010-05-05 16:54:00 2942
原创 更新超参数
更新超参数,因为lambda是对vocabulary的分布情况,因此不进行更新,而lambda是维数为V的vector。而参数alpha和gamma是会随着table和dish的个数变化而发生维数变化的,不仅仅维数变化,连其值也会发生变化。因此,在更新中,只需要更新超参数。而每个超参数都是vector,这样以来,在更新超参数时,需要更新的是vector,而不是一个value。应该是vector中的
2010-05-05 16:53:00 1577
原创 随机分布生成
用C在WINDOWS下编程有一点很不好,就是随机样本的生成很不方便。前一段时间实现HDP时,因为用系统的随机生成的随机数,初始化模型时,效果很不好。因为初始的模型随机性太差,最后用了LDA的经典程序中生成随机数的哪部分程序生成的随机数来初始化模型,效果很不错。但是,像均匀分布、gamma分布,等这样的分布,就很难生成。Y.W.T中的HDP中,gamma分布来生成hyperparameter
2010-05-05 16:53:00 1633
原创 容器的使用
顺序容器的使用在STL中,容器的使用真是比指针还容易出错的。最近本人在用vector存储东西,因此写点关于这个容器的一点点记录。首先,记住容器其实是指针操作。对vector来说,访问每一个元素,有迭代器可以访问,之所以推荐用迭代器,有几个原因。但是,我目前觉得最大的好处就是,方便函数调用时的参数传递。当然,在进行删除erase,插入等操作时,需要迭代器。但是,迭代器也是一种指针,它具有
2010-05-05 16:52:00 532
原创 new delete
因为用到了容器,vector,list的使用,尤其是删除操作,是十分要小心的东西。光是vector,list的删除就让我查了很多资料。感觉c++primer上说的不详细。在使用new delete一般都不会忘记这一对搭档使用的规则。可情况复杂一点就容易忘记。本来vector的内部,用的是结构体形式的数据,可是由于需要传递参数,为了避免取地址,我改成结构体指针了。可在vector的erase操作时,
2010-05-05 16:51:00 380
原创 动态存储
每一个程序在执行时都占用一块可用的内存空间,用于存放动态分配的对象,此内存空间称为程序的自由存储区(free store)或堆(heap)。C语言程序使用一对标准库函数malloc和free在自由存储区中分配存储空间,而C++语言则使用new 和delete表达式实现相同的功能。
2010-05-05 16:50:00 420
原创 编译,头文件
这两天看了写孙鑫的VC++视频,觉得这套内容真的讲的很好。感觉每点都能了解很多东西,当然如果是高手了,可能就不需要了。真想去上个这种培训班。头文件是不进行单独编译的,a.h,a.cpp,在编译源文件.cpp时,如果遇到了#include "a.h",那么会在此处把a.h文件展开,即在此处把a.h的内容完全拷贝过来,进行.cpp的编译。
2010-05-05 16:49:00 428
原创 如何永久性去除word修订标记及批注帮助
如何永久性去除word修订标记及批注帮助可能您已经在 Word 中使用修订或批注功能,却没有意识到。通常在 Word 跟踪更改时,它会用删除线格式显示删除内容,而将插入内容显示为带下划线的文本。删除内容与插入内容— 以及批注(或“注释”)— 都可显示在页边上的批注框中。 有各种方法可以隐藏修改或批注, 但使用修订功能所作的修改会一直打开,而所有插入的批注也一直是文档的一部分,直到它们被
2010-05-05 16:48:00 6318
原创 EM算法学习
在EM算法中,主要是两步:E和M。在E中,所要实现的是计算完整数据的似然期望值,Q-函数,logP(X,H|/theta) P(H|X,/theta),计算期望值。在M中,计算使得Q-函数最大的参数/theta。在计算中,一般利用拉格朗日乘子实现。不断循环下去,得到合适的参数/theta值。 关于EM算法,我想在PRML一书中写的比较详细,再者在chenxiang zhai的not
2010-05-05 16:39:00 601
KLINEMathematicalThoughtFromAncientToModernTimes3.pdf
2019-07-21
dtw for time series data
2019-01-16
Handbook of Statistics Vol 21
2018-12-26
pattern recognition, third edtion,PART3
2009-04-08
pattern recognition,third edtion,PART2
2009-04-08
pattern recognition third edition,PART1
2009-04-08
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人