上周技术关注:《断背山2》之Google爱情故事

  • [Google; 娱乐] 《断背山2》之Google爱情故事 #
    咳咳,今天周末,给大家讲一个发生在Google里面的爱情故事。说到爱情故事,真是无奇不有。如果你对传统男女之间的生离死别感到厌倦,那么李安导演的两个牛仔之间的断背之情可能会在一定程度上满足你的要求。当然,如果你不喜欢牛仔,那么王家卫的《春光乍泄》是个不错的后备选择——至少张国荣与梁朝伟都是国产帅哥。什么?!你很喜欢这种类型的爱情故事?!那好,下面是一个发生在Google里面的《断背山2》。
  • [算法] 一组数据摘要算法的效率测试 #
    一些测试结论* 数据摘要算法的处理是很快的,在一般配置的PC机上使用MD5算法,处理1G的文件数据只需20-30秒(有些专用设备声称达 3GB/秒),不会对应用或机器带来过多负载;* MD5、SHA1虽然被发现存在缺陷(碰撞),但在近几年内,仍然可以大量使用;* SHA256/384/512 的速度较慢,可以用于少量数据摘要,目前不适合用于大文件校验;
  • [iis] HOWTO: Maximize the Number of Concurrent Connections to IIS6 #
    微软IIS7产品组的David Wang教你怎么设置IIS来提供3000个并发连接来做类似server push的事情
    Incidentally, default value for both are above 3,000, so given sufficient HW resources like RAM and well written application software, IIS6 should just work for you out of the box without any tuning. :-)
  • [融资并购; 开源] Red Hat收购JBoss:开源生态转变的里程碑 #
    这笔交易价值3.5亿美元,日后视JBoss财务表现而定,可能再支付7,000万美元。Red Hat不惜投注钜资收购JBoss,显示Red Hat看好未来营收快速增长。
  • [Ruby] 再论ruby #
    Closure、正则表达式、range所有这些特性给人的感觉是写ruby的程序就象写诗一样,它是比Java更高级的语言,或者抽象程度更高的语言。ruby is beautiful。
  • [.NET开发; rss; longhorn] Windows RSS Platform Preview #
    大概看了一下整个文档,然后用C#编了个简单的小程序试了试,还不错,API还算合理好用,这下Desktop平台的对RSS支持变得非常容易了
  • [google; 算法] 一道Google top coder的850分例题及解答 #
    我猜测算法的复杂度能进一步降到 O(N log N),不过自己已经没有能力实现了。另外,为了附庸风雅一把,我发现整个递推算法的过程如果用矩阵来描述,会变得相当清楚。比如对于序列”ABAAB”,很容易构造矩阵A1、B2、A3、A4、B5(每个矩阵都是6阶方阵),初始向量x=[1 0 0 0 0 0]T,生成向量y=B5*A4*A3*B2*A1*x,那么对应的字符串有sum(y)个(sum表示y的各分量之和)。
  • [Adobe; 人物] Adobe的学者约翰—沃洛克博士 #
    Warnock和他的上司Chuck Geschke花了两年的时间定义了一种打印标准Interpress, Interpress是JaM的变种,他们想将Interpress发展成产品,但在施乐的环境下这是不可能的,他们于是决定自己创业提供打印和出版服务。但风险投资家告诉他们:“你们完全不懂服务行业,你们是科学家,应该寻找一种技术型产品。”当时激光打印机十分昂贵,售价约两万美元,他们设想将工作站和打印机结合成一个产品,经过三个月的尝试,他们发现在1982年有六家新成立的公司在计划做同样的产品,而且比他们拥有更多的资金,他们只好又一次修改了创业计划:向计算机公司销售图形软件,设计Postscipt打印控制器,销售Postscript字库,这一次他们成功了。
  • [互联网] 纯真IP数据库格式详解 #
    网络上的IP数据库以纯真版的最为流行,LumaQQ也采用了纯真版IP数据库做为IP查询功能的基础。不过关于其格式的文档却非常之少,后来终于在网上找到了一份文档,得以了解其内幕,不过那份文档寥寥数语,也是颇为耐心才读明白。在这里我重写一份,以此做为LumaQQ开发者文档的一部分,我想还是必要的。本文详细介绍了纯真IP数据库的格式,并且给出了一些Demo以供参考。
  • [搜索技术; 数学; Google; 算法] 数学之美 系列二 -- 谈谈中文分词 #
    如果我们穷举所有可能的分词方法并计算出每种可能性下句子的概率,那么计算量是相当大的。因此,我们可以把它看成是一个动态规划(Dynamic Programming) 的问题,并利用 “维特比”(Viterbi) 算法快速地找到最佳分词。
  • [Google; 演讲] Google CEO的演讲 #
    Google CEO,当然就是Eric Schmidt。这位在“断背山2之Google爱情故事”里有出色表现而被幻灭授予“麦克风最佳配角”的Google掌门人,平时给人的印象的相当的低调。或者是因为Sergey Brin及Larry Page露面过于频繁,以至把Eric的风头都抢走了。不过低调可不等于沉默。昨天Eric在一个名为Economic Club的club里,面对一大堆聚集的人群,进行了一个相当有趣的演讲(via vcc)。演讲中提及了Google对世界的看法以及Google将来的计划等等。我将其中一些有趣的要点译一下,分享如下。
  • [搜索技术; 算法; Google] Google向以色列学生购买新搜索算法 #
    这个算法的名称为Orion(刚好是Ori Alon的简写),它是一种高级相关性文本搜索算法,虽然目前暂时只能用于英文搜索上。这种算法的优点是它可以更准确地“理解”各种搜索关键词之间的关联性,并且能把与搜索关键词相关的所有结果按相关性进行排列,以供选择。它所能实现的效果就是即时把最准确的结果直接显示出来,在很多情况下,你甚至不需要再点击进去某个具体的网站查看更多资料。

更多技术动态,请访问我的365KeyRSS),你可以通过365Key订阅

没有更多推荐了,返回首页