自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(38)
  • 收藏
  • 关注

建立了一个个人blog网站, 可以从evernote上发布blog

建立了一个个人blog网站, 可以从evernote上发布blog,这样就可以在移动环境中发布blog,[url]http://note2share.com/superisaacke[/url] 以后就去那里混了。从功能和UI上网站目前还比较简陋, 不过作为blog也够用了。以后会添加更多的feature.算是使用django和bootstrap的一个实践。...

2012-07-14 21:09:38 258

原创 抽空弄了一个个性化互联网文摘网站

网址在 [url]http://wehuibao.com[/url]总的来说,就是抓取多个微博home timeline(需要授权)中出现的url链接,然后脱水化成为可看的个性化的一个杂志。使用python + mongodb实现,期间自己写了个mongodb 的object mapping。也研究了readability的页面脱水化算法。总的来说还是试验作品。哦,智能手机...

2012-06-21 17:42:22 186

关于编写微博锐推机器人的吐槽。

周末看到新浪和腾讯上缺乏类似rtmeme/rtfocus之类的锐推机器人,以前在饭否上写过饭否小字报,就想看看能否为这些微博平台写一个,后来发现,不是别人不愿意写,而是国内的微博太奇葩了,没有适合这类机器人生存的小土壤也。先上新浪微博平台,申请了应用,发现要上线得用oauth2认证,宣称oauth2认证更简单, 于是把代码从oauth1改成oauth2,期间各种文档中没有提及却遇到的问题就...

2012-05-28 12:40:28 202

利用mouseover事件提高链接响应速度

从浏览器访问一个链接的通常步骤是* 用户将鼠标移到链接上, 此时会发出链接的mouseover事件* 用户点击链接, 产生click, 然后干等服务响应,因服务器响应速度不同,等待时间也不同。但是大多数情况下会产生用户可感知的延迟, 降低了用户的体验。那么是否有可供压榨的空间来缩短用户等待时间呢?让我们来分析一下,由于用户是人,人的动作需要时间,mouseover到click中...

2012-01-16 17:53:00 287

Mongopie,Mongodb的python object mapping

MongoPie是个轻量级的开源python mongodb mapping. 目的是使用Object-Relational Mapping 类似的技术简化mongodb的编程,可以通过继承Model来实现mongodb 的schema.比如,我们要实现一个简单的标签系统,首先定义Model[code="python"]class UserTag(mongopie.Model):...

2011-12-18 00:30:12 143

python的html解析鲁棒性不够

遇到现实社会中各种网页,出错的概率极大,不幸的事, BeautifulSoup也是基于此。若干年前在某搜索公司实习的时候,曾经作个修改HTMLParser的活计,现在不得不重新来一遍。...

2011-12-06 19:02:59 164

node-yesdb:一个nodejs的bitcask k-v数据库的实现

基于bitcask日志模型的k-v数据库有多个实现,比如豆瓣db, riak里的,nodejs也有一个140代码的简单实现(node-cask),我这里实现的目的是,我需要在nodejs中找到一个简单的, 方便,完全异步的kv存储机制,不需要跨服务器分布式系统,类似于sqlite那样的就好了,基于以上,就用纯nodejs实现了一个主要特点是1. 完全异步,这个和node-cask项目不同...

2011-12-04 23:47:04 366

nodejs 的stack于setTimeout

node 可以通过v8 option --stack_size 设置分配的栈大小,缺省的大小是1024K字节(man node 时单位显示为KkBytes,不知道这是神马单位还是typo?)。由于javascript没有尾递归优化,又是异步IO, 对于sequence调用有可能会造成栈溢出。可以采用setTimeout来规避这种风险, 但是setTimeout的性能如何呢?我做的简...

2011-12-04 20:58:24 235

原创 pycetr: 从html文档中提取文档内容

html文档中通常夹杂着各种广告,相关性链接等,提取正文比较困难。pycetr是一个开源项目,用python语言实现了html文档的正文提取。算法基于文章http://www.cs.uiuc.edu/~hanj/pdf/www10_tweninger.pdfContent Extraction via Tag Ratios基本思想是将html分成行,计算每行的文本内...

2011-12-02 19:42:01 126

原创 一小时的极限编程, 关于socket.io

昨天晚上花了一小时,体验了下快速极限编程,使用nodejs express + socket.io + jquery 制作一个极简单的聊天服务器,socket.io果然对于简单而强大[code="shell"]zengke:mchat$ dateMon Nov 28 22:46:02 CST 2011...zengke:mchat$ dateMon Nov 28 2...

2011-11-29 17:14:42 117

编写ganglia python插件

ganglia支持python插件,熟悉了架构后编写起来还是比较简单的. 具体安装过程就不说了,各种系统配置不一样,推荐的安装方法也各有不同,这里只记下基本定制插件的写法.ganglia的体系结构=gmetad + gmond, gmetad作为整个系统的调度和展示的控制中心,gmond则分布在每台受监控机器上定期运行各种监控度量(metric) 并将结果送到gmetad. 插件需...

2011-11-13 18:18:49 156

微博API timeline压缩的想法

智能手机的用户越来越多,但是据统计有一半使用智能手机的人通过GPRS这样的慢速网络上网,当微博客户端使用慢速网络上网时,时间线的数据大小就成为用户体验的关键,如果能压缩数据传输,好处自然是不用说的。让我们看看一个典型的Timeline是什么样的格式。实例如下.[code="java"]{ created_at: 'Tue Nov 08 11:50:41 +0800 2011',...

2011-11-12 13:20:51 192

原创 饭否小字报

饭否小字报,锐推饭否热门消息,推荐活跃人物和新人。http://fanfou.com/ifanfou

2011-09-08 22:52:22 141

原创 使用django开发饭否表白应用

我们几个月前开发了饭否表白,今天终于借着七夕节的东风发布了。这是一种匿名的表白应用,用户可以像其他用户发送匿名的表白,当两人互相发送匿名表白后,系统就公开发出一个表白成功的消息。饭否表白作为应用开发的尝试,是一个比较简单的应用,只有几个页面。使用django开发,尽管django有各种不完美之处,但是django的成熟提供了完整的,统一的框架(同其他组件为基础的第三方框架有区别),保证了有大量...

2011-08-06 19:08:07 230

饭否实现StatusNet 兼容API

Status.net是一个老牌的开源microblog服务器程序,微博网站identi.ca的源代码就是status.net,主要特点在于实现了一套Twitter兼容的API。兼容加上多年的社区经营使其拥有丰富的客户端,涵盖主要的平台, Adobe air, iphone, Desktop, Adium, android, Symbian S60, 黑莓等等。有些使用广泛的客户端也有较好的stat...

2011-07-26 19:04:30 160

原创 饭否微波炉

饭否微波炉,一个匿名聊天站[url]http://chat.fanfouapps.com[/url]用几百行tornado/python代码写成,性价比很高。

2011-05-12 00:41:35 340

原创 半分钟执行一个cronjob的方法

[code="java"]* * * * * root your command* * * * * root sleep 30 && your command[/code]不知可行否

2011-03-26 20:25:29 283

原创 orzbus.com 又重新开张

最近看新浪语音微博的讨论很热烈, 就想起我原来还有个网站有语音微博的功能, 能通过flash在线录音并发布到微博上. 就把它重新run了起来, 站点在 [url]http://orzbus.com/u/zengke[/url], 虽然是个人网站, 速度还能忍受. 计算了一下, 上传一路音频, 带宽占用大概2k字节/s, 每分钟能上传120k字节. 还在忍受范围之内....

2011-02-13 19:46:05 91

原创 unix 下程序monitor的简单实现

用c/c++编的程序, 有时会因为某种错误而终止, 如果我们希望终止了也能及时重启. 那么可以考虑monitor/worker模式.父进程作为monitor, 子进程作真实的工作, 每次子进程终止的时候, monitor通过wait得知, 然后重新fork一个工作子进程, 当monitor被信号杀死的时候, 则杀掉子进程, 唯一的问题是当monitor 被SIGKILL杀死的时候, 无法添...

2011-02-11 10:59:04 257

原创 简单物理引擎的构成

物理引擎的基本元素:1: 各种运动物体, 粒子系统, 比如Ball, Box等.2: 场景的边界和其他不动元素.3: 约束, 约束作用于各个粒子上, 约束他们的行为, 比如管道中, 粒子必须被约束为一维运动, 很多行为都可以概括为约束, 比如碰撞检测, 就是一个作用于两个粒子的约束.通常场景中加入一个粒子的时候, 需要两种约束, 一个用于检查粒子同边界的碰撞, 一种(可能多个)...

2011-02-05 16:21:03 494

原创 Mobileup: 简单的html5物理引擎

在mobileup的演示程序中, 为了演示重力传感器, 添加了一个简单的物理引擎, 可以计算几个小球的碰撞.[img]http://dl.iteye.com/upload/attachment/406638/dd24388b-895a-38be-af6b-401eba182ef8.png[/img]...

2011-01-28 16:50:49 147

原创 Mobileup 的重力传感器控制

Mobileup 的简单demo程序可以传送重力传感器数据, 就如同游戏中可以用手机的传感器控制html5页面的元素了, 很好玩. 下一步是给demo写个若干小球控制的html5页面.[img]http://dl.iteye.com/upload/attachment/405618/97c573a6-44d8-3064-b980-28c7369c73df.png[/img]...

2011-01-26 20:49:01 107

原创 MobileUp: 开源的智能手机javascript开发框架

MobileUp 是一个类似于phonegap的移动平台javascript开发框架或者说一个座落在android手机里的WebOS框架, 远景目标是一次开发到处应用. 目前支持android平台, 开发者用之可以很轻松的使用html/js/css开发美观功能丰富android手机的应用, 而以后等支持了iOS, 黑莓等平台, 则可以很方便的移植到那些平台去而不用重复开发.MobileUp...

2011-01-14 13:50:35 199

原创 一个pthread thread local的包装模板类

pthread 库提供了pthread_key_create, pthread_getspecific, pthread_setspecific方法操作.原理上提供了一个 ==> T的字典pthread_getspecific(key) 方法的作用是查询这个字典, 得到对应的T*, 不同的线程, pthread_self不同, 自然会得到不同的返回值; 同一个线程中如果key不同, ...

2010-12-27 18:25:20 264

原创 Android 开发上奇怪的问题

我在一个android 应用中使用了org.json作数据序列化之类, sdk中编译正常, emulator上运行也正常, 可是导入到机器上(2.2 froyo) 运行的时候, 却报告如此错误E/AndroidRuntime( 1954): java.lang.NoSuchMethodError: org.json.JSONStringer.object非常奇怪, 莫非真机器上的J...

2010-12-12 13:51:49 86

原创 一个切词对联

学习搜索引擎切词的时候大家知道一个著名的切词畸义范例: 长春市长chun药店. 有两种切词方法长春市/长chun/药店长春/市长/chun药店如果把这个当作一个对联, 要求对出下联,除了满足切词的要求, 使每个切出来的词都有意义, 还要满足如下等式s[0] == s[3] && s[1] == s[4]在百度和google上搜了下, 没发现答案, 我自己左思右想也想不出...

2010-11-01 21:34:04 90

原创 写了一个新浪微波应用

写了一个新浪微波应用, 发表水木社区(newsmth) 十大热点话题的信息, 欢迎 在新浪微薄上关注“水木十大" .新浪博客的api文档还是不错的.

2010-08-25 14:12:38 100

原来gmail是用java开发的阿, 还是跑在tomcat上的.

原来gmail是用java开发的阿, 还是跑在tomcat上的. 这是某日访问java得到的错误.[img]http://dl.iteye.com/upload/attachment/281203/a0652041-6f24-3e37-97b6-7721b917ae68.png[/img]...

2010-07-21 21:43:28 155

原创 使用Python语言读JPG文件获取尼康单反相机的快门次数

知识来源[url]http://k.pconline.com.cn/question/101041.html[/url]对于尼康单反相机直出的JPG文件有效, 在我的D90上试过了, 也试过一些D40拍摄的图片, 可以正常使用. 假如以后收购二手相机, 电脑里又没有光影魔术手之类的工具, 比如在linux系统. 就可以用此脚本检查快门数.[code="python"]impor...

2010-05-23 19:39:40 297

选择总是艰难的

面临职业的选择, 两个IT公司, H公司的开发非常不规范, 观念不fashion, 没有免费的饮料点心, 虽然是创业公司, 但是效率却低, 除了工资没有任何其他的指望; F公司属于外企, 开发方式先进, 资金充裕, 可能还有数量可观的期权. 但是我选择了留在前者, 仅仅因为对于H公司, 没有我可能整个开发会遭重创, 而对于F公司则没有这个忧虑. F公司的创始人今天晚上还找我聊天, 试图劝服我改变...

2010-04-28 21:10:17 144

分布式系统的逻辑

1 用一个Agent实例处理所有的逻辑,其他Agent只做服务2 所有Agent都是逻辑的一部分,用Queue总线来交互这两种方案,孰优孰劣?

2010-02-25 17:55:46 173

刚刚傻了

写了个python脚本,第一行没有写shebang, 直接用了import sys, 执行的时候鼠标呈现十字架装, 程序停止不动,还以为出现什么问题了,只好ctrl-c杀掉。后来一想原来使用了ImageMagick的import命令来截屏。...

2010-02-25 14:08:27 190

开发没啥意思了

整天体力劳动般的编码, 还是找机会深造吧.

2010-02-24 22:47:57 172

将股票筛选程序改成遗传算法了

效果不错,以前虽然用蒙特卡洛方法,虽然也能筛选出不错的ant,但是无法证明其稳定性,面对股票池或者其他参数的改变,不一定稳定,因此预测的效果也会大打折扣。而使用遗传算法,则是一代代优选下来的,不好的结果被选择淘汰了,这样稳定性是有保证的,事后的评估也体现了这一点。...

2010-02-24 18:24:35 176

原创 Redqueue 一个用python实现的Queue Server

在网站开发中, Queue Server是广泛使用的组件,实现有简单又复杂,其作用表现为1:使系统的任务更容易分布式处理, 通过tcp/ip网络连接,实现部署透明。2 : 实现任务发布和处理解耦合。发布者不用管处理的组件是谁,同样处理者也不用管发布者是谁。多发布者/多消费者模型可以天然契合。3 : 能缓冲系统中某些部件的压力,创建任务和处理任务的速率可以不一致。[url=http:...

2010-02-24 18:03:55 301

原创 goyacc初体验

google 的go语言里呆了goyacc工具,使用方法基本类似于贝尔实验室的yacc工具. 所以熟悉了解yacc工具的人应该比较容易掌握。不过网上几乎没有找到详细的step by step。 虽然yacc方面的资料比较多, 但是具体细节上goyacc还是有些不同的。所幸在源代码里有一个sample。具体位置是~/go/src/cmd/goyacc/units.y. 算是比较详细。于是照猫画虎...

2010-02-22 16:20:30 1330

原创 栈式数据序列化

以python语言里的marshal为例, 基本序列化方式为: 类型说明+真实数据[code="python"]>>> import marshal>>> marshal.dumps(4.5)'g\x00\x00\x00\x00\x00\x00\x12@'>>> marshal.dumps(3)'i\x03\x00\x00\x00'>>> marshal.dumps('...

2010-02-22 15:00:05 103

原创 分布式计算中序列化的范例

今天粗略地看了[url=http://hadoop.apache.org/avro/docs/current/index.html]Apache Avro[/url]的资料, 这是一种类似于Thrift和ProtocolBuffer的数据序列化工具,看起来不错。主要特点是:有schema定义以及动态类型。 schema定义的好处是能减少数据大小,如果没有schema定义,那么协议处理器不可...

2010-02-22 14:43:44 101

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除