语义,是一条艰难的旅程。语义,只能做到一些特定的事情而已,算法的正确率是有限的,到了某种精度后,再提高一点点就需要花费大量的时间和耐性。但,它是一个没有天花板的空间。这里水很深,全球高手如云,但一旦进入,就上不封顶,有极大的发展空间。它绝对不是一个人能做成的事情,需要很多人很多钱很多机器。阅读全文>
发表于 @ 2008年07月13日 00:32:00|评论(loading...)|收藏
如果用一句话说明,那就是:玩聚SD是techmeme的中国国情改良版。 :D 如果说增加了点儿什么,那么就是techmeme更着眼于物,玩聚SD附加了对人的着眼点。我们这里定义的物,是方军在《网络大图景:人、物与讨论》中对物的定义,即文章或话题。 techmeme的布局强调了话题,至于人(即blogger),并没有特别照顾,除了Leaderboard。 阅读全文>
发表于 @ 2008年07月08日 15:46:00|评论(loading...)|收藏
感谢肚破天惊对玩聚SD的长篇大论,以及精彩的、可操作性很强的建议。 感谢dupola先生的的专业分析之余,我把dupola和曹增辉的几篇SD文章打印出来,仔细地琢磨。 下面这六个问题,估计是国内memeTracker(一、二、三)都需要考虑的问题。阅读全文>
发表于 @ 2008年06月24日 17:41:00|评论(loading...)|收藏
感谢名博风言疯语之IT罗盘对玩聚SD这个非常稚嫩的应用推荐和提出宝贵意见:《玩聚SD:针对博客的创新社会化聚合》。同时对沉默·狼的《玩聚家族:网聚精彩故事》表示感谢!阅读全文>
发表于 @ 2008年06月19日 23:55:00|评论(loading...)|收藏
首先感谢两个小时前曹增辉发布的对玩聚SD的点评《郑昀的玩聚SD和社会化对话》。阐述得非常漂亮,入木三分。 其次,曹兄指出的围绕“人还是内容”构建关键点,涉及信息架构,是个大问题。我一直在左左右右地徘徊。阅读全文>
发表于 @ 2008年06月18日 02:38:00|评论(loading...)|收藏
首先感谢和菜头提到我们,anyway,和菜头也是博客生态圈中最大的意见领袖之一。不管我们表达的多么哀怨,但看到您的宏篇巨制,都不得不躲边儿上偷笑。对于意见领袖,最狠的莫过于TechCrunch宣布某某进入deadpool,那才是最可怕的,直接踹入历史故纸堆。阅读全文>
发表于 @ 2008年06月17日 00:57:00|评论(loading...)|收藏
首先非常感谢电子商务博客和showeb2.0盗盗两位朋友对玩聚SD的推荐,能够在这两位非常优秀的博客上看到SD的名字,真的很感动。【20080616 18:47 updated: 名站网贝也进行了推荐,感谢blacktulip!】【20080616 23:50 updated: 名博和菜头也进行了推荐,感谢!】阅读全文>
发表于 @ 2008年06月16日 01:21:00|评论(loading...)|收藏
“如果只是一种放大器那么撰写博客将会变得无趣。但是像维基百科全书一样,博客将集体智慧用作一种过滤器。被詹姆士·苏瑞奥维奇称为"大众智慧"的规律起了作用,并且就像PageRank技术所产生的结果胜过分析任何单一文档一样,博客圈的集体关注会筛选出有价值的东西。”这就是我的本初想法,也就是玩聚SD的现在实现。阅读全文>
发表于 @ 2008年06月12日 15:34:00|评论(loading...)|收藏
为了让Geek's Blog Social Dialogue更加能够反映中国IT江湖的时下热点,需要尽可能多地收集意见领袖们、IT优秀博客们的RSS地址,来交给这个类似于techmeme般自动实时运行的系统。阅读全文>
发表于 @ 2008年06月04日 00:50:00|评论(loading...)|收藏
语义技术,无非分词、词性标注、分类。如果有几个开源的东西一拼接就行了。如果等你打算做到百度新闻的领域,就会意识到算法是核心竞争力。比如这次改版后的百度新闻,那就必须揉合多种算法,而且必须从本质做大的提升。姑且不说强度很高的文本相似性算法,就说分类,必须提升现在常见的分类算法。因为它分类分得非常细。这时候,必须自己研发。单纯就百度新闻的互联网频道,就好几个子类。十几个大频道,每个都有各种各样很细小的分类,语言特征很模糊。我问过他们,这都是机器自动的,几乎接近于传统媒体网站一大堆编辑的水平了,语义能到这种可商用的强度就难了。算法不是一朝一夕能偷师的。所以,技术门槛还是比较高的。阅读全文>
发表于 @ 2008年02月29日 02:33:00|评论(loading...)|收藏
宝聚产品的特色,就是完全机器驱动,更胜于玩聚热点自动发现 ,所以过年期间,无需人工干预,依然各项功能正常。在国内,打算学习kango.com的旅程自动建议引擎的团队,听说颇有几个,但能够像我们这样早早动手并迅速复制到股票市场并成功推出丰满成熟产品的,独此一家。阅读全文>
发表于 @ 2008年02月26日 00:39:00|评论(loading...)|收藏
正如这次有人评论说的一样“假如给我一两篇精彩的综述,那我是不愿看其他的98%文章的”,文章质量和是否足够具有代表性,只有人(编辑)才能下判断,这是机器智能的缺陷,但可以通过确认信息源的权威性来补,还是有不错的效果的,典型如 techmeme。“报道数”也不是bignews的杀手锏,它的特色我在日志《》和日志《》中都作了阐述,它更强调历史脉络、多媒体性,与玩聚网不谋而合。阅读全文>
发表于 @ 2008年02月09日 22:32:00|评论(loading...)|收藏
1:ask.com和digg.com的这次联姻,是否预示着ask即将收购digg?2:BigNews更像ask,依靠算法行事,而不是过于依赖social;3:BigNews看上去具有Google News和Techmeme的血缘;4:Digg唯一的影响力体现在页面的最下方:Top 5 Diggs in the News,把digg的最热新闻链接放过来了。不过,SAI还说,digg的ratings factor体现在这个站点的算法中。5:ask的这种搜索和过滤器式知识发现(想想看它的track功能),可以帮助digg式的信息过载。6:BigFactor(糅合了影响力及时性多媒体性交互性)是对digg简单的社会化推荐的重大升级。阅读全文>
发表于 @ 2008年02月08日 18:52:00|评论(loading...)|收藏
BigNews
把多媒体特性
把后续追踪
都提升到了很高很高的位置,与百度和谷歌均不同。
这也是差异点。阅读全文>
发表于 @ 2008年02月08日 18:02:00|评论(loading...)|收藏