自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

scsoce blog

python, c/c++, 算法, 搜索引擎, 数学

  • 博客(10)
  • 资源 (1)
  • 收藏
  • 关注

转载 drupal 还是干CMS为核心的网站合适

http://www.mattfarina.com/2009/02/03/is-drupal-a-web-application-framework-or-just-a-content-management-systemI like to refer to Drupal as Submitted by yaph on Tue, 2009-02-03 16:33. I

2009-04-28 11:51:00 364

原创 微妙的quicksort算法

我从quicksort的基本框架出发,得出了一个比较好理解的代码:    def qsort_2( a, s, t ):    if t - s 0:        return    mid = a[s]    l = s     r = t    #print a[s:t+1],    while 1:        while a[l] and  l             l += 1  

2009-01-13 22:06:00 393

原创 寻找中文自描述句子

 在字母语言里面自描述句子的例子( see http://hi.baidu.com/mynana/blog/item/bfb3aeafa707a1cc7dd92a04.html):       "Only the fool would take trouble to verify that this sentence was composed of ten as, three bs, four

2008-12-22 18:43:00 1688

原创 《走进搜索引擎》读书笔记

全书重点在web搜索引擎的各种具体问题和解法,所以本笔记也以问题和解法模式组织。*号表示其它来源但是有价值的内容1. 爬虫    1.1 如何选取起始url        根据web的蝴蝶结结果( 分为in+scc+out, in多是目录形,out是权威型,scc是多数网页),应该尽量选择in和scc的url作为起始url, 通常为各大门户网站和官方网站首页    1.2 抓取策略是选择宽度优先还

2008-11-30 21:44:00 1599

原创 蜘蛛3分钟找到了love

我想知道:一台PC上运行的蜘蛛,从sina.com作为起始url, 最快花多少时间搜索到love这个词?下面是python写的简单的宽度搜索的蜘蛛# -*- coding: UTF-8 -*- given a key and start_url, the spider is suppose to find the key in html as fast as possible.  of 

2008-11-29 20:11:00 493 1

原创 make 学习笔记

 1. basic    1.1 规则: obj.o: x.c y.h              command        obj.o 依赖x.c和y.h,一旦make发现前提(x.c y.h)比目标(obj.o)新或者obj.o根本不存在,则执行command    2. make 只处理“第一个”目标和与之相关的目标,对由此建立的依赖树做后序处理, 如上例中,如果x.c有其他依赖,则先处理

2008-11-26 22:29:00 580

原创 有人用shedskin给一个AI程序加速,结果是196倍的效率提升

 一个哥们写的C程序的仅仅是shedskin版本的1.5-7 倍,而Pysco相对较慢了,只是提升了2.6倍.see: http://ianozsvald.com/2008/11/17/making-python-math-196-faster-with-shedskin/

2008-11-22 22:28:00 790

转载 domstripper - A lxml.html test project

http://www.peterbe.com/plog/domstripper said: lxml是一个全新的c libxml 和libxslt 绑定, 和其它绑定比较,它声称的优势是:   Pythonic API.Documented.Use Python unicode strings in API.Safe (no segfaults).No manual memory manageme

2008-11-20 19:59:00 376

原创 a good tech time schedule

nonsense in advance: time is the most valuable resource, specially to time-consuming activity, such as programming, my ideal plan to use time is listed below:     code time    tool time[ sharp your to

2008-11-20 09:54:00 405

原创 开始作 unofficial planet python 的文摘

我就是那种点子会突然冒出来那种人,经常看python文档,经常读unofficial planet python, 也许是不是抽空做做中文文摘是个好注意.

2008-11-17 13:53:00 468

Hack Proofing Linux - A Guide to Open Source Security.pdf

Hack Proofing Linux - A Guide to Open Source Security.pdf

2009-01-18

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除