自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(15)
  • 收藏
  • 关注

五分钟法则(five minute rules)

1987年,Jim Gray和Gianfranco Putzolu推出了著名的5分钟法则[Gray 1987],他们通过内存,硬盘的性能以及当时的成本,给出了这样的公式:BreakEvenIntervalinSeconds = (PagesPerMBofRAM /AccessesPerSecondPerDisk) × (PricePerDiskDrive /PricePerMBofRAM)。并...

2010-09-24 13:17:00 251

你身边的好友还用QQ吗?

我发现我自己和周边的朋友越来越少用QQ了,除了还保持活跃,基本上所有的同学,朋友都开始远离QQ,社交活动也都选在了renren,sina微博等等。 记得此前看过一篇文章写的很好,主要谈的是人类社交方式的演变。 在互联网出来之前,地理因素是影响社交的重大因素,也是最大障碍。大部分人的社交都在一个有效的距离内,且距离越大产生社交活动的可能性就大幅度减低,具体的概率模型我已经不记得了。...

2010-09-19 13:06:00 56

邓亚萍加盟人民日报社 担任人民搜索一把手

据圈内可靠消息,著名乒乓国手邓亚萍,前国家队乒乓球运动员,即将加盟人民日报社,并担任人民搜索一把手,正式进入搜索引擎行业,邓亚萍是我儿时的偶像,偶像和自己在同一个行业,感到非常高兴,希望人民搜索在邓亚萍的领导下,在宫总,徐总,以及一班兄弟们的努力下越做越好。成为中国乃至世界范围内有地位,有影响力的信息检索服务提供商。如果有兴趣加盟人民搜索的同学们也可以和我联系,我可以帮忙推荐,他们目前正值用...

2010-09-19 12:45:00 80

从用户期望看缩略图和网页有用性之间的关系

今天读了WWW2010会议的一篇论文,由来自google的研究者完成。其中对缩略图进行了深入的探讨。 用Preview Rating和Web Page Rating进行了预览产生的用户期望(Preview Rating)和用户阅读网页后的实际感受(Web Page Rating)之间的差距来判断何种缩略图的形式,用户更加满意。得到了如下结论:实验1左图为网页全景图,图片较小,但网页显...

2010-09-17 12:24:00 51

回答关于网页重排的问题

人民搜索的同事问我此前写的网页重排的博客,其实用【网页重排 pennyliang】就可以搜索到,http://blog.csdn.net/pennyliang/archive/2010/08/02/5781847.aspx。 在WWW2010大会上,有一篇论文写的很好,总结了这方面的方法,也提出了新的方法: Scalable Techniques for Document Identif...

2010-09-12 13:58:00 50

关于web直径的计算问题的解答:

今天看到博客中有一位网友提出了问题,如下: 梁老师,您好。我是通过走进搜索引擎这本书知道您的,这本书我也读了好几遍,就是在这个web直径的公式证明一直无法解决。找到您的博客,所说的方法就是利用可达性矩阵幂次方去做,但是水平有限,梁老师能不能给我一个证明过程,或者是推荐网上的证明页面。 ps:我也利用谷歌搜偶国外的,都没找到这个公式证明。我的邮箱是695950380@qq.com。谢谢...

2010-09-12 12:44:00 85

语言统计学三大定律:Zipf law,Heaps law和Benford law

语言统计学三大定律:Zipf law,Heaps law和Benford lawzipf law:在给定的语料中,对于任意一个term,其频度(freq)的排名(rank)和freq的乘积大致是一个常数。Heaps law:在给定的语料中,其独立的term数(vocabulary的size)v(n)大致是语料大小(n)的一个指数函数。Benford law:在自然形成的十进制数据中,任...

2010-09-10 22:21:00 354

Compute or Memory(续)

计算还是存储,在计算机进行实际运行时,是选择即时计算还是预先计算存储用时提取的方式?人类存储那么多信息为什么?海量数据怎么产生的?面对这些海量的数据产生了怎样的问题? 我认为,人类存储信息一定具有这样两个特征:(1)重用性;(2)凭证性,首先是重用性,如果一个信息不需要重用,也没有必要存储,当然这种重用应该是多次,后一个凭证性,是我杜撰的,就是有些信息,可能永远不会重用,但也可能作为证据...

2010-09-10 17:06:00 77

Compute or Memory?

计算还是记忆?这个抽象的问题容我用两个例子来展开,我们都学过动态规划,用动态规划的方法可以将指数的复杂度降低到多项式的复杂度,例如求斐波那契数,其中一个重要的方法就是把子计算(子结构,也有叫子问题)的计算结果存储下来,遇到想同的计算直接查表获得,而不需重复计算。另外在举个通俗的例子,我考研的时候有一个朋友,数学特别好,脑子好使,我数学不行,最后我们数学的考试成绩差不多,究其原因,他靠的是智力,举...

2010-09-09 12:09:00 79

阿里巴巴云计算老板王坚来清华做了报告

最近我一直在思考一个问题,计算如果可以和水,电一样成为基础设施,那么除了规模大,成本低,服务接入方便等以外,如何度量付费是一个难点,今天清华的新生入学报告,恰好请了阿里巴巴云计算老板王坚来做报告。 我一次见王博士是在CSDN举办的一个大会上,那时就给我留下了思想家的映像,今天清华大学新生入学教育的这次报告中,因为是面向学生,所以报告显得更加具有思想性,内容很丰富,仅就两点回顾一下。...

2010-09-07 13:34:00 137

马云致所有阿里人的一封信:为理想而生存

各位阿里人,几天前,有朋友问我今生最相信什么,我说:”我相信相信!”。最近我发现很多阿里人非常郁闷和难过,大批网络报道指责淘宝网调整搜索结果,甚至还惹起了某些卖家来淘宝网门口抗议…看到那么多同事很委屈,甚至流下了眼泪,也发现不少年轻的淘宝人在不断自问:”我们到底做错了什么,为了鼓励大家在淘宝上创业,坚持七年不向会员强制收取开店费和交易费,坚持扶持发展创业者和中小卖家,七年多的日日夜夜奋斗,结果换回...

2010-09-06 09:22:00 182

ubuntu下编译objectc 与object c++

安装如下的包:$ sudo apt-get install build-essential gnustep gobjc gnustep-make libgnustep-base-dev gnustep-devel建立一个 alias 在 .bashrc 中:alias objcc='gcc `gnustep-config --objc-flags` -lgnustep-base'...

2010-09-05 16:50:00 61

Chinese room是什么?

Chinese room是人工智能领域的一个重要的假想实验(tought experiment),这个实验在1980年出版的Behavioral and Brain Sciences中的一篇叫做“Mind,Brains,and Programs"的论文中首次提到。该论文提出了这样一个问题:如果机器确实模拟出一个智能对话,那么机器是否一定需要理解这些对话的内容? 在这个实验中,Searle假定...

2010-09-05 14:39:00 200

《深入搜索引擎》勘误新增两条 感谢尚家兴同学的指正

第二章 P62 第3段第4行 译文:在这种情况下,需要使用6个算术编码步骤。这看上去很多,实际上很少。 较好的翻译应该是:这看上去很多,但这种情况发生的概率很小。 in this case, six arithmetic encoding stpes would be required. This may seem extreme,but actually it is very r...

2010-09-04 09:49:00 64

从清华大学2010研究生开学典礼说开

昨天开学报道,今天隆重举行了清华大学2010研究生开学典礼,校长和教师代表侃侃而谈,就学习和做研究进行了深入的探讨,特别是化工系的一位院士谈到了,他希望同学们的学习不要太功利,不要总是想着把清华做跳板,总把出国,考研,创业,求职这些结果性的东西挂在嘴边,把学习看做是达到目标的工具,这一点我特别有体会,结合自己的一些经历来谈谈。 在金庸武侠中。把武功看做是一种技能的话,学习计算机也好,学习什么...

2010-09-01 20:10:00 75

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除