Tinyfool@Csdn

天行健,君子以自强不息----本Blog内容均可转载,但是作者不放弃版权,转载必须标明作者和原文地址。

2009年02月23日

原创 Google大牛Jeff Dean在WSDM(ACM的Web搜索和数据挖掘研讨会)2009上面的演讲

原文:Google大牛Jeff Dean在WSDM(ACM的Web搜索和数据挖掘研讨会)2009上面的演讲
昨天看到好像是大辉共享的, Geeking with Greg写的Jeff Dean keynote at WSDM 2009。现在Jeff Dean的Keynote文件和视频貌似都还没公开放出来,所以我把Geeking with Greg的文章翻译如下,方便有兴趣的同学了解一下。Jeff Dean是何许人也呢?呵呵,他就是Google Mapreduce架构的发明者,那篇尽人皆知论文的第一作者。WSDM又是何物呢?WSDM是美国计算机协会ACM组织的Web搜索和数据挖掘研讨会。Jeff Dean在WSDM2009上面演讲的题目是Challenges in Building Large-Scale Information Retrieval Systems(构建大规模信息检索系统中的挑战),演讲介绍了Google从1999年到2009年,数据量,用户查询次数,以及相应架构的变化。

下面是简要译文:

Google Fellow 阅读全文>

发表于 @ 2009年02月23日 14:01:00|评论(loading...)|举报|收藏

2008年08月19日

原创 如果杨致远没有作弊的话,谈Yahoo股东对与Google合作的看法

原文:如果杨致远没有作弊的话,谈Yahoo股东对与Google合作的看法在8月1日的Yahoo股东大会中,杨致远获得了85%的支持率,这显然大跌了很多人的眼睛,立即有股东质疑这次股东大会投票结果的真实性。

如果杨致远没有作弊的话,那么这将说明股东们认可Yahoo拒绝微软的报价和收购要约,甚至认可Yahoo和Google之间可能的合作。那么这就match我对Yahoo和Google合作的看法了(详见:阅读全文>

发表于 @ 2008年08月19日 22:16:00|评论(loading...)|举报|收藏

2008年06月30日

原创 从Google财报出发看Google的业务方向以及我对微软收购雅虎的看法

查看原文:从Google财报出发看Google的业务方向以及我对微软收购雅虎的看法 

本文谈论的都是Google,跟谷歌这种纯粹的流量任务公司没有任何关系。
前些时间一直想对微软蓄谋收购雅虎说三道四一番,那时候我就认为雅虎与其被微软收购,不如与Google携手合作。那时候,我的朋友们就没有一个人相信我的观点,网上还有人说宁可卖给微软,也不跟Google合作云云,说Google才是雅虎真正的敌人。

现在微软收购失败了,虽然仍旧试图跟雅虎达成某种合作,但雅虎与Google确实在广告方面达成了合作协议。我有些后悔没有早点抛出我的观点,现在看起来有点像事后诸葛的感觉了。不过好在最近小可开始好学,之前我的论断来自我的猜测,现在我做阅读全文>

发表于 @ 2008年06月30日 23:18:00|评论(loading...)|举报|收藏

2007年12月28日

原创 程序员的成长从开窍开始

遇到问题的时候: 1. 不要怨天怨地。出了问题,当然有可能是系统的bug,API的问题,但是那些几率往往比你犯低级错误的几率要低多了,先从自己身上找原因,是不是自己写错了。 2. 要掌握工具。最低限度你要会写Log,最好是Log和调试器结合。好的工具可以大大的提高效率。以前有人跟我说,Dll不能调试,我发现可以;有人说多线程不能调试,我发现可以;有人说COM不能调试,我发现可以;有人说 IE插件不能调试,我发现可以;有人说OE插件不能调试,我发现也可以。当然,你确实会遇到不能调试的时候,当年我们做东芝芯片的嵌入程序,一个组都没有一个仿真器和调试器,但是至少可以用Log嘛,无非是麻烦点。 3. 分析问题要有逻辑。遇到问题可以先把所有的可能性都列出来,然后一个一个分析,肯定能找到原因的。 4. 要学会隔离问题。问题涉及到的代码越多,越难以理解,问题越难以解决。遇到这样的情况,可以利用Log或者调试器,一行代码一行代码的给它们洗清嫌疑,这样很快你就可以找到出问题的地方。如果代码特别长,程序特别复杂,可以用二分法来做,效率很高。 5. 千万不要懒惰,阅读全文>

发表于 @ 2007年12月28日 02:55:00|评论(loading...)|举报|收藏

2007年06月03日

原创  CSDN举行的David I见面会(borland->code gear)

我提的问题是: 1、在我看来Borland曾经的危机,主要来自于产品过渡绑定于Windows平台,而这个平台的控制者也在做开发工具生意。请问Code Gear认同这个观点么? 2、基于前面的看法,我认为Code Gear想要发展壮大,应该努力让自己的产品不在依赖于单一平台。而且刚才David I谈到了两点,Code Gear百分之百关注开发者,以及Code Gear开始关注web开发者。基于这个观点,我认为Code Gear更需要努力扩展到更多的平台。因为Php的开发者/Ruby on rails开发者中非Windows平台的开发者比例都是比较高的。我个人就是一个例子,自从把个人主要技术方向转移到Web方向后,立刻就买了一个 MacBook。请问David I怎么看这点?阅读全文>

发表于 @ 2007年06月03日 10:33:00|评论(loading...)|举报|收藏

2007年04月07日

原创  [谷歌不是Google] 我想请李开复博士回答的三个问题!

很早就收到了CSDN 2007英雄大会的邀请,草拟的会议日程中有李开复博士的一个演讲。本想哪天直接跑到谷歌中国办公室去问这些问题,但是估计那样会有生命危险,所以只好写在Blog里面,期待李开复博士能看到,或者期待有人在其他的会议遇到李开复博士,可以帮我问一下。这件事情请问李开复博士是否知道,谷歌公司是否知道?3、在李开复博士忙于与前雇主微软的诚信和竟业禁止官司时,国内舆论都认为李开复博士长期居住在美国,属于超级海归,所以谷歌公司的本地化一定会成为大问题。阅读全文>

发表于 @ 2007年04月07日 00:53:00|评论(loading...)|举报|收藏

原创 CSDN 2007英雄大会印象

不是去上班(我和霍炬开的公司,我们都不坐班,平时在家或者各大小有无线网络覆盖的咖啡厅办公),不是去见客户,而是去参加CSDN2007英雄大会。而这次CSDN的英雄大会,主会场站着的人并不多。但是这次CSDN的英雄大会,从9点半开幕,到下午结束,人始终是那么多。凝聚力很大,一方面当然是要称赞CSDN这个活动搞的好啊;阅读全文>

发表于 @ 2007年04月07日 00:52:00|评论(loading...)|举报|收藏

2006年11月24日

原创 Web应用和PC端软件开发的共同趋势是并行

我们现行的计算机的原理就来自于图灵机,所以过程式的语言跟机器语言有比较简单的对应关系。而函数式语言在现行计算机上面的实现,实际上是一个计算模型的转换。这造成了函数式语言相对过程语言的效率低下,这也就限制了函数式语言在微型机上面的应用。 然而,随着微机平台运算能力的发展,特别是多核等技术的出现。如何提高微型机上应用程序的并行能力等等需求出现了。 有趣的地方正在于此,不管是Web平台还是客户端应用程序开发,趋势都是一样的并行!!!阅读全文>

发表于 @ 2006年11月24日 00:19:00|评论(loading...)|举报|收藏

2006年07月16日

原创 一个Python程序的6次改进

有位朋友用CString类写了一个Email列表去重程序,结果发现处理78000 行的数据居然用了7分多种。于是他用Python的map(hash实现的)重写了这个程序,最后只用了300ms。CString一定会慢,因为实现中没有使用hash。于是有人用c写了一个hash函数来实现这个功能,最后花了400ms。但是代码长度是Python代码的数十倍。详情请看这里。 qyb利用glib的hashtable功能也实现了这个功能,速度超过了Python,但是代码也很简洁。qyb说,“这个例子再一次教育我们,熟练掌握优秀的第三方库是多么的重要.” 我这里没有现成的gcc和glib,不好测试qyb的程序。但是仅就那个用来测试Python程序来说,存在很多降低效率的误区,所以,我把这些问题都用效率更加的方式改写了,从而把程序的效率提高了三倍左右,现在与大家分享。阅读全文>

发表于 @ 2006年07月16日 23:40:00|评论(loading...)|举报|收藏

2006年06月22日

翻译 什么是BOINC?

BOINC是一个利用志愿提供的计算机资源进行分布计算的软件平台。BOINC的特性如下: 在独立的项目间共享资源 许多不同的项目可以使用BOINC。项目之间是独立的;每一个项目操纵自己的服务器和数据库。参与者可以同时参与多个项目;他们可以控制自己参与那些项目,控制他们的资源如何在这些项目间分配。当一个项目完成或者暂时不需要工作的时候,分配给这个项目的资源会自动分配到其他项目上去。 项目特性 BOINC提供如下特性用来简化分布计算项目的创建和操作。 * 可伸缩的应用程序框架 用通用语言(C, C++, Fortran)编写的应用程序略加修改或者完全不改即可作为BOINC应用程序运行。程序可以有多个文件组成。程序的版本升级无需参与者干预。 * 安全 BOINC项目可以阻挡多种类型的攻击。例如,基于公钥加密算法的数字签名可以防止项目被用来传播病毒。 * 多服务器和容错处理 项目可以有各自独立的多个调度和数据服务器。客户端自动尝试轮换服务器,如果所有的服务器都无法访问,客户端利用指数回归算法来尝试阅读全文>

发表于 @ 2006年06月22日 15:13:00|评论(loading...)|举报|收藏

2006年06月19日

原创 打水漂的政府投资和Linux的中文字体问题

政府投资为什么会打水漂? 最近Csdn有篇文章,题目多少有点触目惊心“七年投资换回空心产业 国产Linux前景堪忧”,文章援引一位不愿透露姓名的Linux专家的话,“至今国际正式发布的Linux内核文件中,尚没有中国人开发的一行代码。” 据倪光南院士称,中国每年实际投入到Linux方面的钱都有几亿元人民币规模。我们在2004年了解到中科红旗当年从政府采购得到的收入也达到了上亿元,然而,霍炬的文章中曾问过,“我很想问问,红旗linux到底有什么特点?比red hat好在哪里?比slackware呢?比Debian呢?比knoppix呢?这几个linux发行版也都是小公司。占有率超高的slackware 甚至就是一个人在维护的。如果一个投入了千万研发资金,且几次中标大单的公司,做出来的产品没有什么核心技术,尚且比不上一个人维护的一个linux发行版的话,是不是也过于讽刺了?”这种巨额资金投入,还不如国外几个人的开源团队的成果的现状,被称为“政府投资/采购养猪”。 中国国情有很多特殊的地方,搞项目只要提到信息安全,只要提到防止西方国家技术垄断,就可以获得大量的资金。然而这些阅读全文>

发表于 @ 2006年06月19日 14:06:00|评论(loading...)|举报|收藏

2006年06月11日

翻译 什么是MapReduce? Google的分布运算开发工具!

什么是MapReduce? Google的分布运算开发工具! MapReduce是Google开发的C++编程工具,用于大规模数据集(大于1TB)的并行运算。我关注MapReduce已经很久了,前些日子开始翻译Wikipedia上面的介绍文章,但是由于忙于其他的事务,直到今天才彻底翻译完成,更新了中文维基后,发在自己的Blog上,一方面多一个备份,另一方面方便不能访问维基的朋友查看,再有就是本人翻译水平和技术功底都不够,把译文和原文放在这里,有什么谬误请大家帮助更新维基上面的文章,不能访问维基的留言告知,我会尽快地更新,以免错误的理解和词语应用给大家带来误导。 阅读全文>

发表于 @ 2006年06月11日 02:13:00|评论(loading...)|举报|收藏

2006年03月15日

原创 用命题作文“独立开发商,出路何在?”纪念Borland

详见:用命题作文“独立开发商,出路何在?”纪念Borland阅读全文>

发表于 @ 2006年03月15日 11:38:00|评论(loading...)|举报|收藏

2006年03月12日

原创 豆瓣阿北布道Feedsky技术交流会

详见:豆瓣阿北布道Feedsky技术交流会阅读全文>

发表于 @ 2006年03月12日 03:12:00|评论(loading...)|举报|收藏

Csdn Blog version 3.1a
Copyright © Tinyfool