- 博客(236)
- 收藏
- 关注
原创 如何让EPS嵌入字体
IEEE eXpress在check论文的PDF文件的时候,需要PDF文件嵌入所有的字体。然而, 很多excel,powerpoint或者matlab打印出来的EPS文件并没有嵌入常规字体。这里有2个技巧,让EPS文件嵌入所有字体。1. 在Excel或者powerpoint生成EPS的时候,记住要选择"Print to File"。2. 通过gs命令打印xxxxxx.eps到tem
2012-01-18 00:12:15 8477
原创 UCLA的一篇关于如何使用Linear Programming的文章
转帖这个PDF文件:http://www.ee.ucla.edu/ee236a/lectures/lp.pdf里面很多用法,以前还没想到,特别是对Convex Optimization的变型,很巧妙。再补充一篇MIT的教程资料,里面讲解了如何把各种具体情况form
2011-09-04 02:02:06 3848
原创 工欲善其事必先利其器–SimpleTestBed
最近在研究一个近似的优化算法。在做对比实验的时候,一共要跑6,7个不同的算法来比较。为了公平起见,每个算法需要在几个不同的参数环境下,在几批不同数据下,各自跑几十次,然后看看谁的评价效果最好。一共要跑大概上百次的算法运行。以前的做法是写一个脚本执行,或者说用JUnit之类的单元测试工具来自动化跑。但是,现在的问题是,这上百次的测试,需要花太多时间了。而实际上,我们系有很多空闲的服务器,而且都是8 core和16 core的机器。于是,现在就有两个问题了:
2011-03-11 23:19:00 4237 1
原创 整理一些Markov Random Field以及Graph Model的基础学习资料
最近对于Markov Random Field等Graph Model有点兴趣,想系统学习一下这方面的知识。但是发现网上搜索的很多论文都是比较深入,不知道从何下手。下面是我收集到的一些不错的资料。1. 首先是video lecture上的Prof. Charles Elkan在CIKM08 tutorial (http://videolectures.net/cikm08_elkan_llmacrf)的video。他从最最最基本的probability, maximum likelihood开始讲,
2010-11-07 06:09:00 16912 10
原创 寻找Matlab的替代品
在数学计算上,特别是Numeric computation上,Matlab一直都是最常用的软件。但是,Matlab并非免费软件,即便是最便宜的student version也要$99。虽然在学校的电脑有Matlab,可毕竟不是自己的本本。如果想在家里用,就得登录到学校的机器。这样做开发和调试的时候就不方便了。Octave和SciLab是两个比较著名的数值计算软件,而且都是免费
2010-05-15 14:13:00 23616 5
原创 TL 论坛上关于C++的错误处理的讨论
TL论坛总算回归一些实质性的贴子了。关于C++的错误处理,一直都是一个很有争议性的问题。一些C++大师在教科书上劝说大家应该用异常Exception在错误处理上。但是,很多实际工作的朋友,甚至Google公司都提倡“We do not use C++ Exception”(http://google-styleguide.googlecode.com/svn/trunk/cpp
2010-03-20 09:23:00 3364 2
原创 关于共同生存周期的对象与锁的讨论
之前与同学在谈一道smart pointer的面试题,在实现thread safe的时候发现mutex的destroy始终不好解决。问题在于,当你要destroy的mutex之前,必须先unlock这个mutex,而当你unlock这个mutex的同时,你的destroy部分可能不收保护了。与另外一个同学讨论该问题,告之是锁的设计问题。锁不应该和要锁的对象共享一个生存周期。但是,当我们要实现一
2010-03-09 11:48:00 2752 4
原创 JQuery 1.4发布了
最近一直想写一篇关于JQuery的总结报告,但是时间实在有限。因为现在手上一个database的researchproject大量使用了Javascript作为Web前台开发。从我个人来说,认识Javascript可能都要追溯到高中的时候,但是真的让我感受真正Javascript还是在接触了JQuery之后。在我看来,JQuery或许真的是我所见过最出色的Open Sou
2010-01-17 04:36:00 2648 1
原创 cygwin 1.7升级之后,外部直接访问gcc返回Access is denied
最近一直在弄一些Linux下的环境开发。不过还是一样被抓狂。因为自己的电脑都是Windows系统,所以还是尽量想让工作都在Windows平台下完成。于是我又开始鼓捣cygwin这个东西。不过这次下了最新版本的cygwin1.7,gcc就出现问题了。首先是我的Eclipse的toolchain无法识别cygwin gcc,只能识别到的mingwgcc。然后是直接从cmd.exe
2010-01-17 04:35:00 5356 1
原创 计算机真的是随便其他专业的学生都可以抢饭碗的吗?
在美国似乎很多外专业的同学喜欢来抢ComputerScience同学的饭碗。大家都说计算机是民工专业,随便一个学数学,生物,甚至物理化学的学生都可以很容易踏足这个方向,然后一脚踢开科班出生的Computer ScienceStudents拿到offer。而对于US这边的情况,我不是很了解,但是从国内了解到的情况,的确很多搞计算机很厉害的人并非科班出身。毕竟,计算机现在成了大
2009-11-08 12:54:00 15224 89
原创 我也开始学习Latex了
刚来US不久,老板就说我们这边写论文都用Latex,然后上课的时候也说过大家写作业最好用Latex比较好。于是,我也踏上了学习Latex的道路。其实真正打动让我转向Latex写论文的另外一个搞数据库的朋友。他说过,“如果用Latex,完成一篇论文,可以只需要一个make命令就搞定从跑实验,生成图片,最后生成论文PDF”。想起我以前做过的两篇论文,其中最麻烦的就是反复调整试验参数,然后生成新的图
2009-09-26 12:13:00 3634 1
原创 来美一个月小记
到US来已经有整整一个月多一点的时间了,生活和学习基本也都已经稳定下来了。无论是老板还是同学,都十分关心我刚来美国是否能够适应,而且都告诫我刚到美国肯定是有不适应的地方,要慢慢来。感觉我这个一个月来,遇到的事情和麻烦似乎比一般新生都要多很多,然后现在总算挺过来了。而这些事情对我来说,算是一个很大的磨练,相信今后无论谁都要经历这些的。早一点的经历未必不是一件好事情。 刚来美
2009-09-19 23:01:00 3919 3
原创 多研究一些实际的问题
最近看到很多人都在写大学的回忆录,无论好坏且始终都以一个“成功者”的角度来阐述自己的大学“奋斗”的历程等等。现在想起来,实在是觉得意义不大。其实平常人看到这些东西,应该是获取一种激励,或者说一些学习技巧,少走弯路。每个人的路都不一样,起点差别都很大,用绝对的衡量来比较本身就没多大意义。想起来,反倒是一些“失败者”的经历和故事,让人更加受益。所以,我现在基本上不怎么看那些“成功者”经历
2009-08-07 11:41:00 3251 5
原创 关于数据库系统的学习
前段时间加入TopLanguage的Group,发现这里圈子的还有不少朋友认得我。不少朋友从本科就开始关注,虽然我们并不相识。原以为我的blog会是孤岛,看来自己还是应该花不少时间去更新一下自己的blog了。写blog更多也是对自己生活,学习和工作的总结。记得最早接触blog的还在是04年初,还记得那个时候因为获得了Microsoft的MVP,认识了微软的Grace,在和她的交流中
2009-03-20 22:56:00 6036 1
原创 The Road of Hacking PostgreSQL (1)
最近在写一些大规模数据存储和查询的小程序,发现很多核心的技术还是来自于我们的数据库技术。然后,真正到做的时候才晓得原来自己对于数据库很多本质的东西的理解并不透彻。我感觉,数据库技术真正核心的是数据的物理存储,外存内存交互,索引这些东西。而关系代数,SQL语言这些都是其次的。诸如现在的Google的bigTable等东西,其实最本质的技术还是在数据库领域。和真正做数据库的同学聊
2009-01-20 13:37:00 3191 3
原创 做一个专业的coder(1)
学习coding技能数十载,大部分局限于Windows与Java平台。趁现在有点时间,还是从专业点的LinuxC/C++开发以及环境学习。其实早在几年前,本人还是接触过Linux平台下的C/C++开发,不过始终没有做过什么正式项目,所以不足挂齿。最近一直在写一个开源的高维空间的近似搜索引擎,于是就拿这个开源项目作为练手的项目了。 首先汇报一下自己的开发平台:1) Cygw
2009-01-18 15:52:00 4211
原创 MATLAB生成多张figure以及自动保存
最近开始做毕业论文了。在整理以前做过的诸多论文实验的时候,发现以前用MATLAB写出来的代码是在太混乱了。算法程序,数据生成,以及图片绘画的.m文件都放在一个目录下。不要说拿给别人看,就连我自己时间久了都搞不清楚哪种图片是哪个MATLAB程序生成的。MATLAB没有VisualC++,Java那正规软件开发环境的工程概念,所以人工管理比较麻烦。一般外人拿到一个论文的实验程序,最简单的
2009-01-18 15:51:00 51705 5
原创 关于BI引擎
最近一直在搞实验室和华西出生缺陷中心合作的项目。本来当初我们计划直接在我们当初开发的OpenMiner基础上改进。但是后来在一次开会上,师兄介绍了开源的BI引擎Pentaho(http://www.pentaho.com/)之后,发现Pentaho正是我们当初开发OpenMiner的时候想做的一切。记得还是本科毕业设计的时候,我们也帮学校教务处的运行科做一套数据分析的系统。虽然那个时候W
2009-01-18 15:50:00 5603 1
原创 WAIM09,再进一步
记得投WAIM之前导师就是说过,现在国内针对WAIM的竞争越来越激烈,要突破国内的诸多名牌大学把持的圈子越来越难了。从这次WAIM审稿看得出来,的确如此,以前一篇文章经过3审,现在变成4审了。其实这是一件好事情。要不是4审,我的文章真可能被某人毙了。毕竟,WAIM的程序委员会成员相当大部分都是非内地高校的教授,他们并不参与国内的学术竞争。从ADMA08也看出来,特别是老外,对于文章审稿
2009-01-18 15:49:00 3518
原创 总结一下做文章的方法
作为一个PhD学生来说,写文章的技巧自然是自己的看家本领。总体说来,想写出好的文章,必然是要多读,多写。首先谈谈关于论文阅读的选择。从我们CS的学生来说,最好直接就从最顶级的学术会议,诸如ACM和IEEE的会议论文开始看起。会议论文相对期刊文章来说要简短一些,不至于花太长的时间。一个master学生刚开始看这些文章,肯定会遇到不懂的地方。不过在现在这个互联网发达的时代,学会用Go
2008-09-17 10:14:00 2218 3
原创 初次来杭州
第一次来杭州,天气真是不好,一会下雨,一会出太阳。还好,会议组委会安排的酒店比较舒适,虽说是3星级的酒店,但是感觉比以前住过的5星还舒服。一下飞机,就直奔机场大巴,再转出租车直达酒店。一路上感觉到杭州的气候和成都真的很像,温度,湿度都很接近。不过杭州似乎比成都繁华一些,毕竟是东部沿海城市,而且面积还挺大的。不知道到底是杭州还是成都才是中国第一旅游城市,感觉两个城市真的太相象了。
2008-09-17 10:13:00 1675
原创 这段时间的总结
离去年北上MSRA的实习已经有1年多了。从本科的时候就把MSRA作为自己一直努力奋斗的目标。这个目标终于在07年实现了,而我的07年大半年时光都在MSRA度过。回想起来,那段时间除了work外没有什么前忧后顾,还有一大帮新朋友,老朋友,过得是挺自在的,舒服的。然而,正是这半年多的实习经历改变了自己现在的人生目标。我相信我从本科一直到研究生的几年内,工程方面的积累已经足够我去竞争国内最
2008-09-17 10:12:00 1404 8
原创 SCU BSS讨论帖子
==============回复1================ 算法是计算机科学领域最重要的基石之一,但却受到了国内一些程序员的冷落。许多学生看到一些公司在招聘时要求的编程语言五花八门,就产生了一种误解,认为学计算机就是学各种编程语言,或者认为,学习最新的语言、技术、标准就是最好的铺路方法。其实,大家被这些公司误导了。编程语言虽然该学,但是学习计算机算法和理论更重要,因为计算机语言和开发
2008-06-19 13:29:00 1647 8
原创 Continue to study the advanced experimental programming tools
After having the taste of GSL, somehow, it is not considered as the MATLAB that used in a large group of people. Furthermore, the graphics function and data visualization of MATLAB are important to m
2008-06-06 12:52:00 1154
原创 使用GSL来做实验
熟悉C++做开发的我们,对于matlab, mathematics等软件总是不太习惯。同时,很多research的实验程序需要进行efficiency的对比,所以大部分采用C++是比较合适的。但是诸如矩阵运算,least-squares,随机分布函数等常规数学工具库,matlab实现起来是很直接的。幸好,GNU有一个GSL(GUN Scientific Library)库,里面使用Pure
2008-05-22 09:29:00 1425
原创 学生的职业精神是什么?
没有姚明的火箭比赛,我依然喜欢看,特别是这个赛季的火箭队。这个赛季,火箭队取得了22连胜历史第二佳成绩,更有一种让人敬佩的精神。从斯科拉,兰德里,海耶斯,巴蒂尔,杰克逊这些球员,我们看到一个职业球员为了一个篮板球,地板球,奋不顾身地飞身鱼跃抢夺的那股劲头。他们的拼抢,即使在面对身体更占优势的奥尼尔,高大强壮的内线,位置不占优情况下,明知抢不过,也会依然全力以赴。这不就是我们所倡导的亮剑精神吗?
2008-04-06 16:29:00 1723
原创 头脑VS心灵
到中国可以不看三大殿,不可不看辜鸿铭。1915年辜鸿铭的《中国人的精神》出版,英文出版。这本书写于上个世纪初的一战期间,正值欧洲文明陷入危机之时,辜鸿铭的目的很明显,为陷于危机的欧洲文明、甚至整个世界文明指出一条出路。书中指出中国人的精神,有一条叫做Simple,不是“简单”而是“淳朴”。 中国人的淳朴,往往都是过着小孩一般的心灵生活。为什么说是小孩的心灵,因为从古到今,中国人自身始终难
2008-04-05 12:32:00 1659 4
原创 江安的水吧
传说四川大学江安校区的图书馆是全国Top级别的。在图书馆旁边,还修了一个不大不小的江安水吧,名字还叫XX咖啡。这个水吧的地理位置太爽,从外面窗户外面,直接就可以看到江安的超大人工湖,很清净的地方。今天,参加了微软亚洲研究院MSRA的搜索技术中心STC的几个领导在江安的座谈会。几位领导针对STC做了一些介绍,然后就开始和大家的提问互答的阶段。因为对于搜索引擎的infrastructure的东西比
2008-03-31 11:50:00 1787
原创 First paper comes out!!!
这两天,总算把第一篇文章赶出来了。每天都活在一大堆数据里面,一次实验就要跑半天。幸好我有两台机器可以使用,否则实验一跑起来,CPU占用就100%了,什么事情都不能做了。第一篇paper居然做得那么不容易,中间题目换了又换,相关文章读了不知道多少篇。大家都说,第一篇文章最好找一个简单点的来做,那样容易获得信心。可是我的第一次,却偏偏选了一条困难的路来走,还好这个路上,我的意志还够坚强。总得说来
2008-03-25 01:29:00 1220
转载 Hard Drive
无意中看到博客堂的一篇关于微软创业的帖子。回想当初,自己11岁的时候,就开始学习计算机编程,也是因为一本Bill Gates写的《未来之路》,才激发自己对于计算机,对于编程那么大的热情。 (转自博客堂Vincent Chen)前一段时间读了一本名为《Hard Drive》的书,它以纪实文体讲述了微软公司的成立和发展历史,其中包含了许多对当事人的真实采访资料,书中还对创始人Bill Gates和
2008-02-16 00:49:00 1895 1
原创 原来学习是如此地苦涩
最近一直在忙第一篇Paper,虽然想法大致的框架成熟了,但是还有一些细节需要完善。这几天在电脑旁边做的事情就两件:看Paper和搜Paper。好不容易找到姜同学一起来合作,于是合作的前期工作就是看前人的paper。除了自己下的paper,大家也互相交流了不少。估计这几天看过相关的SIGMOD,VLDB文章没有10篇也有7-8篇了吧。回想以前研一的时候,一个学期也没读过那么多篇顶级的文章。
2008-01-16 22:57:00 2098 2
原创 做研究,没有基础怎么行
以前听说过很多人一个月,一个星期就可以写一篇文章出来,于是觉得只有有一个idea马上就可以写论文了,特别是对于很多职业写手来说,一年发个7,8篇的EI文章是很轻松的事情。其实,一个普通的idea,平时随时都可以想到,但是99%可能都是前人想过的,甚至做过得。为什么自己会觉得是一个新idea? 我想主要原因还是因为自己看得比较少,读的论文比较少,知识面比较狭窄导致的。一般人要找一个现在没有前人完
2008-01-07 01:24:00 4445 8
原创 C Low-Level I/O functions
以前在看别人的很多代码时候,经常看到低级的C语言文件I/O函数。不过自己却从来还没有用到过低级的I/O函数。在纯C里面就f开头的stream用得多。这次要做SIDB在底层实现数据库存储文件,就得必须依靠低级文件I/O才能做了。因为低级文件I/O提供了某些功能,而高级文件I/O函数中没有。 这是我在网上找到为什么要使用低级IO的一些原因: 摘自: http://www.linuxtopi
2007-12-24 14:30:00 2358
原创 关于Windows下C++开发的64位和32位通讯的问题
现在64位的系统已经十分普及了。在MSRA实习的时候,几乎所有的Server都是64位的Windows Server,而我自己开发使用的机器还是普通的32位系统。在处理网络通讯的时候,经常需要把整数类型的数据转换成二进制流传输,那么就会遇到32位机器和64位机器之间通讯的情况。 C++默认的int变量,都是根据具体编译环境来定,如果是32位下编译,就是4个字节宽度,如果是64位机器下就是8
2007-12-24 00:21:00 5221 2
原创 讨论班上汇报的P2P Database论文
总算在这学期,第一次在讨论班上汇报了一篇论文。这学期的论文都是今年的SIGMOD会议上的文章,而我这次汇报是一篇P2P相关的Database文章"P-Ring An Efficient and Robust P2P Range Index"。P2P主要在系统的Scalability和Fault-tolerance上比较突出。这也算是我第一次那么仔细读完一篇SIGMOD的文章。 实验室的同学从
2007-12-22 01:51:00 1678 1
原创 重新开始在学校的生活了
回学校已经快两周了。本以为回学校会很轻松的,过上舒服的日子,没想到那么快又投入新的战斗了。新战斗就是写paper。一个是NDBC数据库会议的论文,机会不能放过,还有明年在本校召开的ADMA,也是不错的会议。当然,对于博士来说来说可能档次低了些,但是对于硕士来说还是可以的。 这周听了新加坡国立大学的黄教授等人的讲座,感觉收获还是颇丰富的。其实他的关于P2P的研究学术讲座倒是没什么兴趣,后来我
2007-12-14 01:03:00 2107 2
原创 结束了在MSRA的实习
从5月到11月底,总共在MSRA渡过了7个月的实习时光。这7个月似乎是我感觉过得最快的7个月。或许是一个人在北京,生活上没有太多的琐事,只有很单纯的工作,于是就有这种时光飞逝的感觉。当然,记忆里面也并非都是工作上的事情,在MSRA还认识来自五湖四海的不少朋友,这或许正是每个MSRA的intern最大收获之一。现在又回到了学校,回到了无比熟悉的寝室,感觉在北京的7个月就像梦一样。 总体来说
2007-12-14 00:59:00 12440 2
原创 批量增加文件头注释的python小程序
import sysimport osimport globimport stringdef isBlankLine(line): for ch in line: if ch in [ , , ] : continue else: return False return Truesys.arg
2007-11-30 00:04:00 3652 1
转载 自我提高的十大技巧
虽然我没有尽力把下面的每一条技巧都付诸实践,但我确实每天都作出一点努力了。下面列举的就是我最喜欢的自我提高的十大技巧。每天只要付出一点,你就会看到惊喜的变化,可以把你的秘诀添加进去做评估。 10.有一个好的开头 这 意味着起床和早餐要早。只有这样你才能有充沛的精力去遵照其他条例做事。如果你起得很早,你甚至可以例行再做一点晨练。假如你和其他人生
2007-11-21 12:42:00 3653 2
原创 令人激动的Google手机操作系统Android
做过几年的Symbian手机游戏开发,也做过几年J2ME上的程序开发,对于手机上的应用开发,一向都是我比较关注的。然而,似乎这一切都没有让 Google推出的GPhone让人如此激动和兴奋。GPhone的手机操作系统Android终于在2007年11月13日正式发布了,而且还是一个开 源的操作系统,内核为Linux。以往的各种手机平台,都过于封闭,都是传统手机制造厂商把持了其应用程序的主流开发,而
2007-11-17 17:16:00 5621 4
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人