自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

逆风而行

一泓清水

  • 博客(37)
  • 资源 (5)
  • 收藏
  • 关注

原创 猴年总结及规划

从今年开始,重拾博客。去年主要经历了几件大事。工作方面,科研有了突破,发了1篇文章;项目顺利结题;考上了在职博士(最终放弃);换了一份工作,收入有所增长。生活方面,娶了一个贤妻良母的老婆,办了婚礼,人生又上一台阶。缺点是新工作需要从头再来,未来充满变数。组建了家庭,责任重了许多,因此要从今年开始为未来做好打算。工作上要有所突破,争取做一两个出色的项目,在公司做出成绩;出国一次;业余时间多学

2016-02-14 22:49:30 664

原创 centos 系统维护笔记

如果系统版本比较老,各种升级,

2014-05-08 10:41:18 793

原创 又是一年

又是一年。除了岁月洒下的痕迹,和朦胧的回忆,还有沉沦的空白。又是一年。东风何时来。这消沉的空气,正慢慢磨蚀心智。又是一年。少梦的酣睡真甜。光阴开始新的轮转。又是一年。

2013-12-27 13:55:14 857

原创 gearman c 回调函数无法使用的问题

交换设置回调函数的顺序就好了。

2013-07-11 16:10:07 735

原创 毕业了

压抑太久了,熬了三年终于到这天了。某自觉NX的评委,预答辩憋着问题,正式答辩的时候就纠缠数据集问。本来公开的数据集没有,非说不用可信的数据集,就没有说服力,就一文不值。结果不出意料,没有一个评委给我优秀。是啊,给了优秀也浪费,毕业就万事OK。各位评委老师,谢谢你们的英明的决定啊。再见吧,硕士生涯。继续隐忍,直到从这里走出去。

2013-05-13 21:15:25 712

原创 中文分词工具witfoxsegment发布了!

0.2版的witfoxsegment终于发布了。点击这里下载。该软件可以作为分词工具,或者作为学习的工具。它最初也是我的一个课程作业。它还不支持UTF8编码的文本。留着以后升级。0.1版的witfoxsegment可以在这里下载。

2013-04-10 16:50:48 771

翻译 Voted Perceptron(投票感知器算法)

方法说明:       Voted Perceptron算法基于Rosenblatt and Frank在1957年提出的感知器算法,它充分利用了具有大分界面的线性可分数据。该算法具有实现简单,比SVM更高效的特点,也被运用于使用核函数的高维空间问题中。有人[Manabu Sassano, IJCNLP]在自然语言处理实验中比较了Voted Perceptron和SVM的分类效率,发现Vote

2013-03-12 09:52:30 6020

原创 eclipse 启动时一闪而过,不能正常启动办法

打开eclipse,启动画面一闪而过退出。原因:jdk多次安装或升级,导致安装路径出现混乱,eclipse无法正常启动。解决方法:以下每一步结束都重启eclipse一下,看能不能正常启动。1、修改eclipse安装目录下的eclipse.ini文件,在-vmargs参数前添加-vmF:\software\JDK\jre\bin\javaw.exe再次启动eclipse,

2013-02-23 11:18:05 7670 2

原创 腊八

腊八腊八,莲子花生煮开花。何日归家?文档代码都还差。奇葩奇葩,好好网站让它挂。思念不达,什么时候不误杀?

2013-01-19 10:15:44 594

转载 假如今天是生命的最后一天

假如今天是生命的最后一天去尽情享用最爱的午餐不让自己留有遗憾让自己穿得温暖免遭躯体的折磨总之,学会生活得更加舒坦 假如今天是生命的最后一天感恩父母给了我生的机会感激老师给了解一双慧眼感谢朋友给了我帮助和关怀为此,我噙着热泪向他们在声说——我爱你们 假如今天是生命的最后一天忘掉在今天来临之前的昨天无论是辉煌还是黑暗微笑地面对自信

2013-01-14 19:29:26 664

原创 找工作得失

找工作真累!找工作真辛苦!找工作真纠结!谈谈“三工”问题。一、找工作花费4个月:从9月到12月,长得要命路费:200¥(公交)+100(打的)简历投递次数:70(网络投递)+现场投递(50)体重:-1kg衣服:700¥二、满意的OFFER只要认真找,好工作都是有的。最合适的才是最满意的。三、找工作存在的问题1、没有认清自己。不了解自己,不能确

2012-12-28 20:48:00 658

原创 三个门的问题

问题:你参加了一个电视节目,主持人给你展示了3扇门,其中1个门后有巨额奖品,另2个门后是空的,并且主持人知道奖品在哪扇门后。如果你选择了A门,然后主持人打开C门,是空的,这时他问你是否要改变你的选择放弃A门选B门。 你会坚持你的选择吗? 答案是:改变选择。模拟整个过程的程序如下:#include #include #include int main(){int i,

2012-12-27 23:42:12 1272

原创 末日来临,抓住最后时刻!

还等什么,快去领船票!

2012-12-21 01:24:17 618

原创 笔试题总结

1、sizeof应用short b(){return 1;}int main(){char a[]={'a','b','c','d'};printf("sizeof=%d\n",sizeof(a));printf("sizeof=%d\n",sizeof(main()));printf("sizeof=%d\n",sizeof(main));printf("

2012-09-16 09:17:30 733

原创 snmp编程

一、SNMP简介SNMP是一构建在TCP/UDP上的远程监控应用。它能监控网络中主机的各种信息,如内存使用率,CPU占用率,磁盘占用率等。它主要分为2个部分,安装在待监控主机上的SNMP服务端,用于收集主机的信息,并按树形进行组织;安装在监控端的SNMP客户端,实时发出查询命令,获得被监控主机的运行信息。SNMP服务端:将主机信息按树形进行组织,有点类似windows的注册表,但是简单得多

2012-09-14 19:55:10 14276

原创 linux shell编程

这两天需要用到shell编程,总算复习了下旧知识。1.字符串处理1)截取子串substring=`awk '-F[ ]' '{print substr($src_str,$start_position,$substring_length)'`substring=`echo $sr_string|cut -c$start_postion-$end_postion`substr

2012-09-14 17:36:46 724

原创 通用堆排序实现

//对数组中的元素按堆排序void sift(void* a, int esize,int i, int n,int(*cmp)(void *,void*,void *),void *param,void *tmp){    int child;memcpy(tmp,(char*)a+esize*i,esize);    while(n >= 2 * (i+1)){

2012-06-16 20:20:11 754 1

原创 模拟网页访问的工具-htmlunit

实际应用中,经常需要程序自动访问网页,执行一些操作。c#或MFC自带的browser需要创建窗口,不太方便。htmlunit作为一款开源的Java浏览器,能模拟各种网页访问,对js支持友好,文档齐全,使用起来非常方便。而曾经很流行的httpunit由于更新较慢,很多Js已经支持不了。使用htmlunit主要有以下三步:1)创建浏览器客户端:WebClient wc=nnew WebClie

2012-03-16 20:50:50 8207 1

原创 别了,2011

这个总结似乎还没怎么想好。因为实在没有什么拿得出来的收获。唯一欣慰的是收获了爱情。一想到这里就高兴得像吃了蜜一样。看了几部小说,弹了点吉他,跳了段街舞。没有参加班级各种比赛,没有参加实验室年终会,没有获得奖学金,没有发文章。做了点半生不熟的项目,挣了点外快没有学到新的东西。翻开2011的计划,发现差得太远。2012,希望能安装自己的计划走!

2012-01-17 13:23:47 788 2

原创 供应google+邀请码

现有g+邀请码,需要的跟我发邮件relwarc@163.com

2011-09-03 20:11:10 993

原创 简单的版面分析

文本图像的版面分析     版面分析是指分析一副文本图像的块结构,以便进行后续的OCR识别处理。由于关系都识别的准确性和正确的文字顺序,版面分析显得特别重要。本文介绍简单的版面分析方法。       版面分析中规则起到了很大的作用。一般的文本图像具有以下一些特征:1)段内行距比段间行距小;2)段首有空白,段尾有空白;3)图像的黑像素比例比文字大;4)文章排版横纵有规律性等。利用这些

2011-07-07 00:02:16 7513 6

原创 tesseract出bug了

这两天测试的时候发现tesseract行为很怪异,版面分析后切分的块大小居然比原始图片还大。难道是我程序出问题了?要是tesseract本身出问题就麻烦了——看那庞大的代码库就只有哭了。反复检查自己的代码,实在找不到错在哪。没办法,只好硬着头皮看看库里面是怎么实现的了。最后,终于发现tesseract-3.00版本的baseapi.cpp文件的一个函数似乎少写了一行代码,添上之后问题就消失了。原来

2011-07-01 02:01:00 1012

原创 中文分词工具

自己实现的中文分词工具witfox,效果还行。准备以后改进。更新了网址,可以下载了。

2011-06-16 00:35:00 1013

原创 OCR识别引擎tesseract使用方法

      最近一直跟OCR打交道,学习了下google的OCR引擎TESSERACT,是个很好的识别工具。tesseract-3.0已支持版面分析,功能很强大。安装tesseract前可选择性地安装leptonica和libtiff。不过建议先安装这两个库。不安装tiff的话只能处理bmp文件。     这里只是说明怎么识别中文。依次安装好libtiff,leptonica和tesserac

2011-06-16 00:28:00 25145 10

原创 对3Q大战的一点见解

<br />2010年的3Q大战是互联网行业竞争最激烈的、影响最广泛的互联网事件。它们一个是及时通信软件的老大,掌握庞大的QQ用户群,一个是杀毒软件的新秀,占据着杀软市场占有率第一的头把交椅。它们都为了自身利益,打着保护用户隐私的幌子,在用户桌面上大打出手,于用户权益不顾。3Q大战反映了行业法律约束的无力,网民权益的脆弱,更折射出我国IT行业广泛存在的抄袭现象。虽然这场争论已过去半年,但暴露的问题至今仍令所有互联网从业者和管理者深思。<br />硝烟散去,回顾整个事件的首末,不禁让人思考这场战争为什么能打起

2011-05-14 09:32:00 3052

原创 图像处理

<br />最近纠缠于文本图像处理,总算告一段落。<br />对一幅文本图像,首先进行去噪。通过高斯滤波方法滤去噪声。然后检测图像的倾斜角度。参考了一篇介绍用线性回归方法的论文后,并不断尝试,终于获得理想效果,准确提取了图像的倾斜角度。但是对不同大小的字体是否准确,需要进一步测试。

2011-03-13 00:39:00 806

原创 数据缓存与本地存储

开发中常常碰到需要本地保存一份远程的镜像,如数据库服务器上的表,以减少网络查询的延迟,提高程序的效率。笔者碰到这种情况时,多编写一个内容管理工具,将远程的数据备份到本地,提供插入,删除,修改,遍历等功能,非常方便。虽然没有berkeleyDB复杂,但也能满足一般需要。      该工具由缓存和文件存储两部分构成。缓存的设计方法在前文已经介绍,这里只介绍下文件内容的存储管理。假设要处理的记录是等

2011-03-06 21:44:00 3068

原创 Chernoff bound(切诺夫界)

马尔科夫不等式:    X为非负随机变量,E(X)存在,对任意t>0,有  Pr[x>t]chernoff 界:    X1,X2,...,Xn为独立泊松事件,Pr[Xi=1]=pi,X=sigma(i=0,n)Xi,u=E[X],对任意的&,0下界     Pr[X上界     Pr[X>(1+&)u]   X1,X2,...,Xn为离散独立随机变量,E{Xi}=0 |Xi|   Pr[|X|>=t]   Pr[X>=t]

2011-01-02 14:57:00 32316

原创 新年第一天

<br />今天本科同学聚餐,见到了一群在科大走过的同学,兴奋!

2011-01-01 17:00:00 737

原创 简单缓存设计

<br />    在项目开发中,缓存起到至关重要的作用,它能加快程序运行的速度,提高程序性能。按照缓存是否备份到磁盘中,可将缓存分为两种:只在内存中运行,断电后消失;与磁盘中的文件进行交换,下次启动时能从文件中恢复。笔者在实际中用到了几种缓存,下面简单总结。<br />    1,堆栈式缓存。这种缓存适合存储大小一致的数据块。初始化时首先获得一个大的内存区域,均分为若干小块。两个单向链表,即空闲链表和数据链表。开始空闲链表指向内存块,数据链表为空。当要写数据时,先从空闲链表中获取一个空闲块,添加到数据链表

2011-01-01 03:15:00 1294

原创 spandsp与传真开发

    spandsp是一个传真处理引擎,包含了从调制,发送,解调,编码各种功能。

2010-12-29 23:00:00 6970 4

原创 创业

<br />     今天听一个师兄说不要轻易创业,作为研究生还是先找一份可靠的工作为要。好像很多创业的人都说不要创业,但是好多在学校的人都把事业的最高境界定义为拥有一家自己的公司。颇似围城。<br />     最近对一个创业项目感兴趣。我对一切关于创业中涉及到的商业过程感兴趣,但对他们做的东西不怎么感兴趣。因为我觉得创业一定要有自己的特色或者不同的想法,思路,可能有点理想主义吧。但大家现在就打算把别人做过的东西重新做一遍。<br />    很犹豫是否继续下去,而且我自己的项目上事情也没做完。<br /

2010-12-12 02:06:00 780

原创 可望不可即的档案

<br />     到新学校读书快两个月的时候,忽然得到通知说我的档案还没收到。据说整个学校就差我的档案,情况很严重,限我一个月内必须找到,不然就被清退。<br />    得此噩耗,悲情万分,小概率事件也能发生在我身上。想来北京真是不顺,第一次来的时候银行说我的身份证号码查不到,不给开账户,第二次来居然要被打回原籍。<br />    曾听说本科学校对毕业生就像泼出去的水,但没办法,只好求助以前善良的辅导员老师。还好跟了四年的辅导员老师还是以前那样热情,答应帮我找政府的机要局查查档案下落,但要一周以后才

2010-12-12 01:46:00 673

原创 感受龙芯电脑

<br />      前天去办公室,忽然发现门口居然摆着一台电子书大小的龙芯笔记本,旁边的小条写着:请你体验龙芯电脑。惊讶之余,迫不及待地上前试用起来。白色外观,小巧轻薄,感觉不超过12寸。再看操作界面,跟XP已有几分相似,有我的电脑,开始等图标。打开目录,发现文件夹图标也跟XP很像。到文件的时候已是linux的图标了。其他的配置还没来得及看,别人在催我了。下次有机会一定好好体验国产芯笔记本。<br />      以前看过一篇批评龙芯的帖子,说得虽然有些理,但是我欣赏龙芯,支持它,希望它逐步摆脱抄袭嫌疑

2010-10-30 17:01:00 828

原创 ubuntu下secureCRT乱码

<br />查看可支持的编码<br />locale -m<br />手动将ubuntu环境设置为GBK<br />1、首先设置sudo vi /var/lib/locales/supported.d/local<br />添加一行 zh_CN.GBK GBK<br />2、sudo locale-gen<br />3、编辑/etc/profile<br />LANG=zh_CN.UTF-8<br />LANGUAGE=<br />LC_ALL=zh_CN.UTF-8<br /><br />export L

2010-10-28 02:03:00 1433 2

原创 WAVE PCM 声音文件格式

<br />WAVE文件格式是Microsoft为存储多媒体的RIFF规范的一部分。一个RIFF文件以一个文件头开始,然后是一系列的数据块。一个WAVE文件常常仅由一个WAVE块构成,WAVE块包含一个说明格式的fmt块和存储取样信息的数据块。<br />标准WAVE文件格式<br /><br /><br /><br />偏移<br />长度(字节)<br />变量名<br />描述<br />备注<br />0<br />4<br />ChunkID<br />ASCII字符“RIFF”,大端形式<br

2010-08-10 19:49:00 8695 2

原创 无题

<br />      在CSDN上写博还是第一次.心里还是很高兴,毕竟有这么多的牛人在里面.以前都是网上搜索到他们的文章,觉得自己也该写点东西.以来可以向众多牛人学习交流,二来可以锻炼下自己的文笔.<br />      首先觉得学计算机的人很多,牛人更多。觉得压力很大。其次觉得我国计算机行业需要比较大的变革,产生一个影响发展方向的变化,不然整个行业死气沉沉的。希望自己以后多花点时间学习,掌握本领,也好写几篇文章出来供大家分享。

2010-08-01 19:46:00 632

加密与解密

经典的攻防教程,值得一看。费了很大劲收集到的

2012-02-07

人月神话-软件项目管理

一部介绍软件项目管理的经典书籍,虽然出来有些时间了,但一直是高手必读宝典。

2010-07-29

算法导论 英文第二版

学习算法的经典书籍,虽然是英文,但通俗易懂,是值得一看的好书!

2009-10-08

rootkit--windows安全防护

深入介绍windows内核,介绍hook的原理的专著,值得一看。电子书是英文原版,阅读起来不是很难。对打算研究hook的人是一本很好的入门书籍。但是读之前最好能懂驱动。

2009-05-27

计算机系统结构试验源代码

计算机系统结构4个实验的源代码,分别是静态内存调度,单功能流水线,静态多功能流水线和动态多功能流水线,望对别人有所收获!

2009-03-18

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除