旁观者 - 郑昀

软件开发这些年来,不断地遇到新领域新知识点,屡屡感受到新进入者的迷惑和彷徨,所以对遇到的每一个问题都详细记录问题现象、解决思路以及解决方案,并在blog中留下印迹,以备他日有心人google之而知之。你们的新手之痛,你们的新业务发展之初的思路混沌,我都感同身受,所以欢迎和我一起探讨这些话题,诸如文本挖掘/自然语言处理/Web3.0/J2ME/Web2.0/IVR/SMS/MMS/WAP/SIP/等等,知无不言言无不尽。

用户操作
[留言]  [发消息]  [加为好友] 
订阅我的博客
XML聚合    FeedSky
订阅到鲜果
订阅到Google
订阅到抓虾
zhengyun_ustc的公告
<strong><a href="http://blog.csdn.net/zhengyun_ustc/archive/2005/04/06/338511.aspx"><font color="red" size="3">查看我的简历</font></a></strong><br/> <script src="http://sr.ju690.com/static/script/SRbacks.js"></script> <script type='text/javascript' charset='gb2312' src='http://it.ju690.com/meme/widget/get?num=8&columns=1&bj=F9FAF5&bc=D8DBBC&lc=2D8509&tc=AAAAAA&'></script> <br/> <font color="red"><b>订阅我的博客:</b></font><br/><a href="http://fusion.google.com/add?feedurl=http://blog.csdn.net/zhengyun_ustc/Rss.aspx"><img src="http://beta.feedsky.com/images/icon_subshot01_google.gif" alt="google reader" style="margin-bottom: 3px;" border="0" vspace="2"></a><br><a href="http://www.xianguo.com/subscribe.php?url=http://blog.csdn.net/zhengyun_ustc/Rss.aspx" target="_blank"><img src="http://beta.feedsky.com/images/icon_subshot01_xianguo.gif" alt="订阅郑昀到鲜果" style="margin-bottom: 3px;" border="0" vspace="2"></a><br><a href="http://www.zhuaxia.com/add_channel.php?url=http://feeds.feedsky.com/csdn.net/zhengyun_ustc"><img src="http://beta.feedsky.com/images/icon_subshot01_zhuaxia.gif" alt="订阅郑昀到抓虾" style="margin-bottom: 3px;" border="0" vspace="2"></a> <br/> <font color="red"><b>联系我:</b></font><br/> <img src="http://album.hi.csdn.net/app_uploads/zhengyun_ustc/20081028/195351995.p.jpg?d=20081028195409917"/> <br/> <img src="http://album.hi.csdn.net/app_uploads/zhengyun_ustc/20081028/195111011.p.jpg?d=20081028195157573"/> <br/> <font color="red"><b>我的J2ME创意</b></font><br/> <a href="http://blog.csdn.net/zhengyun_ustc/archive/2006/03/28/641991.aspx">{8.手机流媒体之实作}</a><br/> <a href="http://blog.csdn.net/zhengyun_ustc/archive/2006/03/20/630431.aspx">{7.2.增强型二级菜单[SaltedFish]}</a><br/> <a href="http://blog.csdn.net/zhengyun_ustc/archive/2006/02/17/601434.aspx">{7.1.二级菜单绘制演示-OperaMini风格}</a><br/> <a href="http://blog.csdn.net/zhengyun_ustc/archive/2005/12/27/563341.aspx">{6.Bloglines手机伴侣-Online Rss Service Reader}</a><br/> <a href="http://blog.csdn.net/zhengyun_ustc/archive/2005/11/07/524616.aspx">{5.手机玩转点对点MSN传情动漫}</a><br/> <a href="http://blog.csdn.net/zhengyun_ustc/archive/2005/10/31/519798.aspx">{4.手机玩Podcasting, 无线播客新玩法!}</a><br/> <a href="http://blog.csdn.net/zhengyun_ustc/archive/2005/10/24/514949.aspx">{3.手机看交通监视器实时录像}</a><br/> <a href="http://blog.csdn.net/zhengyun_ustc/archive/2005/10/13/502354.aspx"> {2.VideoCoolala-- [MobileWebCam]}</a><br/> <a href="http://blog.csdn.net/zhengyun_ustc/archive/2005/10/07/496816.aspx">{ 1.RSSOwlMidlet (RSS无线阅读器)}</a><br/>
文章分类
友情链接
宝聚-股市风向标
玩聚
玩聚SD(RSS)
玩聚SR(RSS)
草根网(RSS)
存档
2010年01月23日

原创 热推榜单的遏制策略

而从人类的感觉上,至少要能有几个标签,比如名词、动词、形容词等,才能证明一个tweet可能包含有一定信息量,值得被传播。所以强制要求有N个标签被检测到的规则,恰好能逼近这种人类的认知。阅读全文>

发表于 @ 2010年01月23日 23:12:00 | 评论( loading... ) | 编辑| 举报| 收藏

2010年01月18日

原创 大中华之事件监测

大致的框架就是这样。玩聚HOT还在内测中(所以暂不提供RSS和微博帐号),不排除打散逻辑重新组合,但基本哲学应该就是这些了。阅读全文>

发表于 @ 2010年01月18日 03:13:00 | 评论( loading... ) | 编辑| 举报| 收藏

2010年01月14日

原创 为什么公共场合听不到那些少数人的观点?[ZT]

从 http://is.gd/6fWyt 学会一个概念:『沉默的螺旋 http://is.gd/6fWDd 』阅读全文>

发表于 @ 2010年01月14日 23:43:00 | 评论( loading... ) | 编辑| 举报| 收藏

2010年01月07日

原创 谈热文榜的自动去重

现在的重复内容检测逻辑是: 首先对文章内容较长的,是基于Shingle的重复检测办法; 其次对文章很短的,比如cnBeta摘要输出的RSS内容,比如Solidot,比如南方报业旗下的RSS内容,先提取标签,然后计算文章的标签相似度。 这两种办法算起来很快,但未必总能检测出来重复,继续积累吧。 阅读全文>

发表于 @ 2010年01月07日 00:56:00 | 评论( loading... ) | 编辑| 举报| 收藏

2010年01月06日

转载 中国科大: 那些杀手都很冷[ZT]

科大的杀手们,:D阅读全文>

发表于 @ 2010年01月06日 00:40:00 | 评论( loading... ) | 编辑| 举报| 收藏

2010年01月05日

原创 才知道系列:先退卡、再吐钞

说先退卡是为了规避忘记取卡的风险,是对的。这属于典型的两害相权取其轻。阅读全文>

发表于 @ 2010年01月05日 22:52:00 | 评论( loading... ) | 编辑| 举报| 收藏

2009年12月23日

原创 理性声音少吗?

所以,不是“已经很少存在理性的声音了”(一点都不少),而是“不迷信权威、不非黑即白、能理性思考的受众人数相对太少”,无法让有理有据的观点第一时间传播。相反,那些乱力怪神、情感激烈、奇技淫巧的论点会快速传播,人的接收信息能力有限时,就会让这些声音充斥大脑,而根本接收不到理性的声音。阅读全文>

发表于 @ 2009年12月23日 19:54:00 | 评论( loading... ) | 编辑| 举报| 收藏

2009年12月15日

原创 转世

所以,综上所述,《降世神通(Avatar)》的转世设定应该是取材于藏传佛教,而不是印度教或佛教。阅读全文>

发表于 @ 2009年12月15日 06:39:00 | 评论( loading... ) | 编辑| 举报| 收藏

原创 才知道系列之五[耳环|TMD]

goldengrape说:『看了降世神通Avatar,才知道原来Avatar转世系统中不遵守灵魂守恒,而是每一次转世,就复制一份。紧急情况下与灵界沟通,进入Avatar state, 前世Avatar可以注入能量。这个转世系统很牛逼,值得修炼。』 北京报道 郑昀阅读全文>

发表于 @ 2009年12月15日 02:17:00 | 评论( loading... ) | 编辑| 举报| 收藏

2009年12月13日

原创 网聊:把自己的idea变成现实时别忘了这些点

在一开始的时候,当自己还是一张白纸时,珍惜自己的职业荣誉吧。 简单地说,如何珍惜自己的职业荣誉,就是最开始不以金钱为短期目的,而是以打造自己职场形象为主,以做口碑为主,要保证做一个成一个,至少雁过留声,让别人知道你的idea、技术、运营还可以,千万别做一个得罪一群人,做一个死一个,那就严重影响你以后的IT圈子声誉了。 站长之间互相都知道的。站长们和当年的红卫兵一样经常串联的。阅读全文>

发表于 @ 2009年12月13日 03:08:00 | 评论( loading... ) | 编辑| 举报| 收藏

2009年12月12日

原创 围观一个People Search

如果你真的对前面那个People Search感兴趣,不妨看看他们的开源代码: itswhoyouknow[Social Network Browser] 至少你可以观摩一下它的javascript是如何对Google Social Graph API再次封装的,如何调用Google AJAX Search API 的。阅读全文>

发表于 @ 2009年12月12日 03:00:00 | 评论( loading... ) | 编辑| 举报| 收藏

2009年12月09日

原创 中国广电工信战争

战斗还在继续。广电四胜一平。阅读全文>

发表于 @ 2009年12月09日 15:50:00 | 评论( loading... ) | 编辑| 举报| 收藏

2009年12月05日

原创 随手小记:才知道[语言cosplay|DoubleTaylor]

才知道系列之四.才知道 豆瓣有个组叫豆瓣档cos江湖 ,动辄数千人以回贴加扮演的形式cosplay各种剧集。还演化出更复杂的师徒系统 。另一个组里海藻、宋思明和小贝都在cosplay了:http://is.gd/5a6sA 阅读全文>

发表于 @ 2009年12月05日 22:03:00 | 评论( loading... ) | 编辑| 举报| 收藏

2009年11月27日

原创 描述如何从网页提取结构化数据的语言:Parsley

Parsley是一个挺有意思的小东西,它综合运用了CSS、XPath、正则表达式和JSON,是描述如何从网页里提取结构化数据的简单语言。估计做爬虫(Crawler/Spider)的人都会定义一套类似的模板。只不过Parsley还帮你把具体实现做了,用各种开发语言。 阅读全文>

发表于 @ 2009年11月27日 23:43:00 | 评论( loading... ) | 编辑| 举报| 收藏

2009年11月25日

原创 数据挖掘时用特征缩小范围很重要

郑昀 @玩聚RT 20091124随便聊起来,说到Social数据挖掘,有一点小小的见解,请看:我们在中国大陆考虑从social数据挖掘寻找新价值的时候,一般要考虑两个点:1、是否有足够多的数据; 2、这些数据如何证明是有效/有价值的;或者说你能用什么办法清洗数据。一般来说,多数idea遇到第一个问题时就败了。 OneRiot 或者之所以有用,之所以他的Pulse Rank 大家还觉得有点意思,就是因为不管搜索什么,人家英文数据都足够多。数据寥寥无几,什么Rank 、什么排序 就一点意义都没有了。所以我曾经说过机器智能能够进入的垂直领域特点之一就是『信息源:网络资讯足够丰富,碎片多且分散』 ,数据少的话,根本不需要机器智能,雇一个编辑就全部搞定了,而且数据变化少,你机器加工半天搞出来的数据,人家其他网站转眼就能给你copy/paste走。过了第一个点,但没有特征作为入口的话,第一,直接考验你的机器并行处理和索引能力,第二,你需要花费大量时间处理阅读全文>

发表于 @ 2009年11月25日 02:30:00 | 评论( loading... ) | 编辑| 举报| 收藏

第1页,共47页
第一页上一页下一页最后一页
Copyright © zhengyun_ustc
Powered by CSDN Blog