自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

Eager逃亡

在岁月的幻影里时间如此真实

  • 博客(8)
  • 资源 (1)
  • 收藏
  • 关注

原创 《搜索引擎原理、技术与系统》读书笔记(2)——分词算法

 “基于字典的机械分词”是最基本的分词法。“机械”是强调:分词算法不进行语法分析,也不会尝试建立语义网络。“基于字典”说明算法的效果依赖于字典的质量和容量。当然太大的字典又会造成速度上的问题。另有一类不依赖于字典的分词算法,使用基于概率的聚类法聚字成词。 两个基础的算法是MM(最大匹配)和RMM(逆向最大匹配)。二者的区别仅仅在于扫描的方向。最大匹配的算法描述起来非常简单:从当前位置开

2008-12-10 21:00:00 676

原创 《搜索引擎原理、技术与系统》读书笔记(1)

今天读了一下午《搜索引擎原理、技术与系统》,做点笔记。简单说来,搜索引擎由以下三部分组成:蜘蛛一只预处理器若干自带用户界面的查询器一只只要凑齐了这三件东西,我们在自己的PC上也可以跑一个搜索引擎。它与Google那骇人听闻的服务器集群相比,只有吞吐量、响应速度和收录率的差别而已。蜘蛛:蜘蛛(Spider),又叫爬虫,agent什么的,总之就是一个程序用来采集互联网上的网页。采集到的页面越多、速

2008-12-10 00:54:00 643

原创 又是表决心贴

道虽远不行不至。成天YY也不是个事,是时候动手做一些事情了。鉴于一代算法小天才沦为搞网游的残酷现实,为了两年之后能做自己真正喜爱的工作,我必须加油了。经验值不会无中生有,搞网游不涨经验槽。想要升级,还得自己去做任务。对于以下领域,应保持长期的关注:搜索技术,数据挖掘,文本处理,机器学习,人工神经网络除此之外,还要自己动手做项目,研究过的东西才是自己的。目前搜索技术最大路货,就从这个简单的开始吧。

2008-12-02 23:22:00 732

原创 8.7及未来的三天,酱油引导人民

8.7和8.8,技术报告和总结阶段。8.9和8.10,渡假阶段。综上所述,为庆祝OG开幕,本人的技术工作进入打酱油阶段。PS,谁能教教我傅立叶变换……

2008-08-08 10:49:00 1429

原创 8.6,PCA,我需要冷静一下。

拼图法取得了突破性进展。现在拼出来的视图已经一点也不后现代了……我是说,图像的完整性很好,像素基本上是连续的──还是放效果图吧:其实我所做的不过是稍微修改了评价函数,增加了一项“位移惩罚”而已。于是那些小方块终于不再乱跑了……无论如何,这个成果加强了我对拼图法的信心。接下来只需要引入快速搜索算法,提高匹配效率,速度场方面的工作就可以完成了。在另一只手上,辐射法总是受挫。不仅写的代码老bug,而且我

2008-08-07 09:39:00 592

原创 8.5,解构主义拼图

今天的主题是拼图法,目标是速度场,结局是后现代……有图,嗯。拼图法是用最原始的FS搜索法实现的,效率慢得一B。接下来必须使用各种快速搜索算法来提高速度,此为方向一。不幸的是,提高搜索速度必然带来匹配精度的损失,而目前的匹配效果已经很后现代了……目前使用的距离函数是“MAD”。据说视频压缩中都用这个。但我觉得这事一个想当简陋的做法。距离函数尚有改进之处,此为方向之二。在这幅解构主义的拼图中,有些像素

2008-08-06 12:30:00 454

原创 8.4,七年了,我还是不懂你的心……傅立叶变换。

速度场法是目前考虑的重点。所谓速度场,是图像上人身上每一像素的运动速度──当然指帧间运动。求速度场有多种思路,而且彼此几乎是垂直的。比如通过相邻两帧间的差异对比,或者通过在全部帧中识别某个特定像素的连续运动轨迹。著名的“光流法”算是前者的一种实现,虽然我认为这是一种很扯淡的算法。目前我的思路是拼图法──把前一帧撕成小块,然后到后一帧上去玩拼图游戏。我承认这个想法是受到了“多媒体技术”中运动补偿算法

2008-08-05 08:50:00 902

原创 8.3,一周打酱油工作回顾

进入机器视觉组打酱油已经是第七天了。然想到要写日记,那个许多大科学家不都有实验日记吗?等我挂了之后,我的某个传记作者可以这样写道:“承蒙Eager小女儿XXX女士的好意,使我有幸翻阅了Eager 22岁时的实验日记,我发现…………”,靠,倍儿有感觉。所以为给将来为我写传记的潦倒文人提供方便,我要开始记流水帐了。本周以来主要研究了几个算法:XA:通过异或(Xor)运算和与(And)运算实现的运动目标

2008-08-03 22:33:00 602

Java科学计算器

Java课程的作业,实现了数学公式显示的Java科学计算器。

2008-07-24

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除