malefactor's 布拉格

从历史阅读未来

张俊林ID:malefactor
97374次访问,排名894好友0人,关注者10
中科院软件所博士学位,研究领域:搜索引擎,自然语言处理。现在从事相关的开发与研究。
malefactor的文章
原创 54 篇
翻译 1 篇
转载 1 篇
评论 69 篇
malefactor的公告
最近评论
eric:呵呵。。有意思
onlytiancai:大多都没看懂,像你说的算法原理都不知道是啥,感觉压缩之后没法解压了吧
gunilla:假设LOG文件由以下三个域构成,个人认为用户ID这个假设不成立,原因有三:
1、Google不需要用户注册,如何识别同一用户?
2、就算可以通过IP地址来识别,一个IP地址可以对应多台电脑?
3、就算一个IP地址可以对应一台电脑,一台电脑又有可能多人同时使用,如何判断出是那个人发出的搜索请求?
savager:我想可以通过声音识别来防止这类事情的发生。
taige5555:钱不是问题,问题是没钱!

转载
文章分类
收藏
    相册
    我读过与正在读的书
    友情链接
    我的个人主页
    存档
    软件项目交易
    订阅我的博客
    XML聚合  FeedSky
    订阅到鲜果
    订阅到Google
    订阅到抓虾
    订阅到BlogLines
    订阅到Yahoo
    订阅到GouGou
    订阅到飞鸽
    订阅到Rojo
    订阅到newsgator
    订阅到netvibes
    2008年01月09日

    原创  百度新闻后台逻辑流程分析

    今天分析了一下百度新闻,琢磨了一下其后台运行机制,出乎意料的是,我发现其运行机制比我想象的要简单,我原先没仔细看,以为至少会用到文本聚类,但是分析结果显示好像没用到,只是使用了文本分类和文本相似性计算而已。 阅读全文>

    发表于 @ 2008年01月09日 18:53:00|评论(loading...)|编辑

    2007年09月30日

    转载 谁说中国人没有幽默感?哈哈(转贴)

    1.钻石恒久远,一颗就破产~~ 2. 水能载舟,亦能煮粥 [ 转自铁血社区 http://bbs.tiexue.net/ ] 3.黑夜给了我黑色的眼睛,我却用它翻白眼 4.不怕虎一样的敌人,就怕猪一样的队友 ! 5.满城尽待年终奖,弄弄才是喇叭腔 6. 一山不能容二虎,除非一公和一母! 7.我假装认真地工作,老板假装认真地付薪水阅读全文>

    发表于 @ 2007年09月30日 11:37:00|评论(loading...)|编辑

    2007年08月23日

    原创  从选秀策略看市场测试

    选秀节目就是做给电视观众的一盘菜,一大批做梦都流着哈喇子想一夜成名的小朋友就相当于西红柿啊番茄啊这些不同种类的水灵灵还种在地里的蔬菜; 一小批做梦也流着哈喇子想就此收视长红的地方以及中央电视台就是炒菜那锅,当然锅的质地有区别,有钢锅有高压锅有砂锅也有火锅;个别做梦不再流哈喇子的已经比较有名气的而且必须懂得如何煽情骗观众泪水的主持人就是那锅铲子;个别也做梦流哈喇子的半红不紫的但是想终结这种半红不紫状态的口无遮拦的爱心泛滥的评委(比如自己把自己炒糊的这两位)就是炒菜一定不可或缺的调料阅读全文>

    发表于 @ 2007年08月23日 21:45:00|评论(loading...)|编辑

    2007年07月24日

    原创 搜索2.0:利用用户点击记录改善搜索结果

    现在是WEB2.0时代了(据真实传言好像已经快4.0了,比微软升级还快,我估计年底前会出现web5.0的说法,大家赶紧想想应该是什么,争取第一个提出这个概念,为中国争光),大家都在讲UGC(用户产生内容。My definition of UGC2.0:Used Garbage Content(come on,just a joke)),如果从利用用户产生的内容来提高网站效果这个角度看,其实搜索引擎早几年前已经迈入WEB2.0的行列了,因为搜索引擎会记录用户发出的查询以及用户点击记录,然后利用这些用户产生的搜索记录来进一步改善其他用户的搜索结果。阅读全文>

    发表于 @ 2007年07月24日 21:19:00|评论(loading...)|编辑

    2007年07月04日

    原创 新知客:现代“买椟还珠”故事

    新知客的前身好像叫,是天津一家出版社出的,定位和现在的类似,没改版前我是追着买但是往往买不到,因为销售终端很少。自从改名改版以来,杂志内容越来越无法恭维,其转型的狼子野心越来越露骨阅读全文>

    发表于 @ 2007年07月04日 21:32:00|评论(loading...)|编辑

    2007年06月12日

    原创 BSP细分时代即将来临

    BSP的发展脉络可以整理为: a.blog概念进入中国,产生国内第一个BSP网站; b.产生大大小小的同质化的模仿网站; c.经过一番竞争后,大浪淘沙,大批中小型BSP网站关张大吉,少数BSP存活下来;(现在我们处于这个世界) d.存活下来的BSP在主打方向上开始发生分化,同时一些垂直行业的领先网站逐步开始提供专业性BSP服务; e.博客作者分别在不同的BSP开设BLOG,根据BSP的优势发表不同领域的博客文章; f.重复上述D和E步骤,形成了专业化BSP市场,BSP成为成熟市场; 阅读全文>

    发表于 @ 2007年06月12日 17:59:00|评论(loading...)|编辑

    2007年04月30日

    原创  Google小组研发模式分析

    GOOGLE和其他大公司采用不同的研发模式,其研发模式是小组开发。这个研发模式可以说是GOOGLE目前最大的核心竞争力。这种研发模式诱发了不断的创新。但是很明显的一点是:这种研发模式只是适用于现阶段GOOGLE的模式,最终这种模式会被其他研发模式取代。 阅读全文>

    发表于 @ 2007年04月30日 13:45:00|评论(loading...)|编辑

    2007年04月22日

    翻译 视频搜索时代到来了吗?[翻译]

    尽管很令人伤感但是这是真实的--我们可以通过衡量某个市场的可被操纵程度来评估任何市场的成熟程度. 根据这一衡量标准,从华尔街周刊的"作弊手段正在侵蚀视频站点并误导用户"一文可以推断: 视频搜索时代已经到来. 阅读全文>

    发表于 @ 2007年04月22日 14:59:00|评论(loading...)|编辑

    原创 未来的电视是什么样子?

    假设现在是2030年,那么此时的电视是什么样子呢? 阅读全文>

    发表于 @ 2007年04月22日 14:17:00|评论(loading...)|编辑

    原创 互联网大鳄的成长模式

    所谓互联网大鳄的含义,可以通过举例来说明,从国际上说比如如日中天的GOOGLE,微软,雅虎,从国内来说比如百度,腾讯等。一般来说,这些公司从互联网新秀成长到互联网大鳄要经过以下五个阶段:第一阶段:新秀期。第二阶段:核心业务垄断期 第三阶段:核心业务扩张期 第四阶段:多元化时期 第五阶段。挑战者出现时期阅读全文>

    发表于 @ 2007年04月22日 09:33:00|评论(loading...)|编辑

    Csdn Blog version 3.1a
    Copyright © malefactor