自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

  • 博客(51)
  • 收藏
  • 关注

原创 无限级分类:预排序遍历树算法与递归

1 lft 代表左 left 2 rgt 代表右 right 下面这个图是一个典型的结构1 查看整个树(A)有多少节点(包含自己) 直接看根节点就行了 (right-left+1)/2 = (20-1+1)/2 = 10 这个数有10个节点 2 查看从节点A到E的路径select * from tree where lft between 1 and 6 and r

2011-11-22 17:09:22 1163

原创 python 产生随机数示例

本文用代码示例详细说明了如何用 Python 生成随机数随机整数:  >>> import random  >>> random.randint(0,99)  21    随机选取0到100间的偶数:     >>> import random  >>> random.randrange(0, 101, 2)  42

2011-11-18 19:17:09 911

原创 重温Python的XML工具

进一步介绍 python 的 XML 工具David Mertz 创作的可爱的 Python 的第一、第二部分概述了在 Python 中使用 XML。然而,在那些最初的文章出现后,Python 中的 XML 工具有了很大的发展。不幸的是,这些改进中的大多数并不向后兼容。在这个特别部分中,重温了作者先前对 XML 工具的讨论,并提供最新的代码示例。在许多情况下,Python 是使用 XML

2011-11-18 19:16:46 577

原创 httplib HTTP协议客户端实现

httplib 是 python中http 协议的客户端实现,可以使用该模块来与 HTTP 服务器进行交互。httplib的内容不是很多,也比较简单。以下是一个非常简单的例子, 使用httplib获取google首页的html:  httplib 是 python中http 协议的客户端实现,可以使用该模块来与 HTTP 服务器进行交互。httplib的内容不是很多,也比较简单。以下是

2011-11-18 19:11:29 710

原创 python模块之uuid

uuid是一种唯一标识,在许多领域作为标识用途。 python的uuid模块就是用来生成它的。闲话不说,python提供的生成uuid的方法一共有4种,分别是:1.从硬件地址和时间生成2.从md5算法生成3.随机生成4.从SHA-1算法生成他们在uuid模块里对应uuid1, uuid3, uuid4, uuid5这几个方法,注意没有uuid2。下面是示例:

2011-11-18 19:05:42 684 1

原创 ConfigParser模块学习: 用python解析配置文件

在程序中使用配置文件来灵活的配置一些参数是一件很常 见的事情,配置文件的解析并不复杂,在python里更是如此,在官方发布的库中就包含有做这件事情的库,那就是ConfigParser,这里简单的做 一些介绍。    ConfigParser解析的配置文件的格式比较象ini的配置文件格式,就是文件中由多个section构成,每个section下又有多个配置项, 比如:

2011-11-18 19:01:16 508

原创 hashlib模块学习:hash算法库

hashlib是个专门提供hash算法的库,现在里面包括md5, sha1, sha224, sha256, sha384, sha512,使用非常简单、方便。md5经常用来做用户密码的存储。而sha1则经常用作数字签名。下面看看代码吧: #-*- encoding:gb2312 -*-  import hashlib   a = "a test string" print

2011-11-18 19:00:20 545

转载 Python图书概览 -- 分类指引电子书 swords

Python 电子书本地收集 -- 啄木鸟空间分享了大部分请大家一一 对应指引本地下载链接是也乎……ZoomQuiet 前言本页面收集整理了 Python 相关的书籍信息书名一般链接至其主页或 Amazon/China-Pub 相关页面,往往包括试读、书评、勘误、源码、补充内容等相关资源,国内出版的书也可直接在线购买。Python 安装包中附带的官方文档永远是最有价

2011-11-18 18:59:16 1020

转载 Python开发编码规范

Python开发编码规范文档化开发注释规范目录Python Coding Rule介绍一致性的建议代码的布局缩进制表符还是空格?行的最大长度空行编码导入空格其它建议注释注释块行内注释文档化版本注记命名约定描述:命名风格说明:命名约定应避免的名字模块名类名异常名全局变量名函数名方法名和实例变量继承

2011-11-18 18:57:30 751

转载 文档化开发注释规范

文档化开发注释规范目录原则文档化标签基础标签命令py常用命令py文献信息py状态信息py模块信息py函式信息py提醒信息py关联信息py标签格式py注释风格dox常用命令dox文献信息dox状态信息dox模块信息dox函式信息dox提醒信息dox关联信息dox标签格式dox注释风格输出美化控制块结构段落列表章节第 1

2011-11-18 18:56:53 807

转载 6本学习Python的免费电子书

Python 逐渐地流行了起来,现在经常被用来作为初学者的入门语言。我们为初学者们选择了一些比较适合的免费 Python 书籍去学习。便宜并不是没好货,这里的一些书籍已经被很多大学作为课本来使用,比如麻省理工的计算机科学与编程入门课程,加利福尼亚大学的编程思想课程都用到了下面的某(几)本书籍。简明 Python 教程 ( A Byte of Python )简明 Python

2011-11-18 17:41:17 1264 1

原创 Python抓取框架 Scrapy 的架构分析

最近在学Python,同时也在学如何使用python抓取数据,于是就被我发现了这个非常受欢迎的Python抓取框架Scrapy,下面一起学习下Scrapy的架构,便于更好的使用这个工具。一、概述下图显示了Scrapy的大体架构,其中包含了它的主要组件及系统的数据处理流程(绿色箭头所示)。下面就来一个个解释每个组件的作用及数据的处理过程。 二、组件1、Scrapy Engine(

2011-11-18 17:34:43 839

转载 [RabbitMQ+Python入门经典]

RabbitMQ作为一个工业级的消息队列服务器,在其客户端手册列表的Python段当中推荐了一篇blog,作为RabbitMQ+Python的入门手册再合适不过了。不过,正如其标题Rabbit and Warrens(兔 子和养兔场)一样,这篇英文写的相当俏皮,以至于对于我等非英文读者来说不像一般的技术文档那么好懂,所以,翻译一下吧。翻译过了,希望其他人可以少用一 些时间。翻译水平有限,不可能

2011-11-18 17:27:54 814

原创 使用 PIL 生成验证码图片

现在的网页中,为了防止机器人提交表单,图片验证码是很常见的应对手段之一。这里就不详细介绍了,相信大家都遇到过。现在就给出用Python的PIL库实现验证码图片的代码。代码中有详细注释。#!/usr/bin/env python#coding=utf-8import randomfrom PIL import Image, ImageDraw, ImageFont,Ima

2011-11-18 17:16:22 823

原创 python中文处理好方法

用python处理字符串很容易,但是在处理中文的时候需要注意一些问题。比如:a = "我们是python爱好者"print a[0]只能输出“我”字的前半部分,要想输出整个的我字还需要b = a[0:2]print b才行,很不方便,并且当一段文本中同时有中英文?氖焙蚝苣汛怼?最好的办法就是转换为unicode。像这样:c = un

2011-11-18 17:05:18 328

原创 python常用的时间方法

我们先导入必须用到的一个module>>> import time设置一个时间的格式,下面会用到>>>ISOTIMEFORMAT=’%Y-%m-%d %X’看一下当前的时间,和其他很多语言相似这是从epoch(1970 年 1 月 1 日 00:00:00)开始到当前的秒数。>>> time.time()1180759620.859上面的看不懂,换个格式来看看>>>

2011-11-18 17:03:38 305

转载 LINUX应用技巧,序列化存储 Python 对象

持久性持久性的基本思想很简单。假定有一个 Python 程序,它可能是一个管理日常待办事项的程序,您希望在多次执行这个程序之间可以保存应用程序对象(待办事项)。换句话说,您希望将对象存储在磁盘上,便于 以后检索。这就是持久性。要达到这个目的,有几种方法,每一种方法都有其优缺点。例如,可以将对象数据存储在某种格式的文本文件中,譬如 CSV 文件。或者可以用关系数据库,譬如 Gadfly、My

2011-11-17 19:51:03 437

转载 拥抱SQLAlchemy 之一 一见钟情

自打接触了python,就被深深的吸引,首先是它频繁出现在我工作使用的著名GIS软件中,一次为了给一个GIS软件写点脚本,就尝试了一下,这一尝试不要紧,心从此就被他栓住了,再开发什么东西首先就考虑用python去做。为什么会被python吸引的,我思考后得出这个结论:1、语言简练,亲切,容易学习2、开源的库众多,只要你能想到就能得到 得知有一个很NB的ORM框架SQLAlche

2011-11-10 13:56:15 2352 1

原创 在Yii中整合Smarty

本文介绍Yii如何整合Smarty。虽然说Yii的viewhelper已经够强大,CHtml,Jui..等等,甚至可以灵活的扩展这些组件,整合Smarty确实有点舍近求远。但是萝卜白菜,各有所爱,Yii灵活的扩展性,即插即用的Components,very gelivable

2011-10-09 17:14:04 1394

转载 一致性哈希算法及其在分布式系统中的应用

摘要本文将会从实际应用场景出发,介绍一致性哈希算法(Consistent Hashing)及其在分布式系统中的应用。首先本文会描述一个在日常开发中经常会遇到的问题场景,借此介绍一致性哈希算法以及这个算法如何解决此问题;接下来会对这个算法进行相对详细的描述,并讨论一些如虚拟节点

2011-10-09 16:00:41 284

转载 Facebook 架构学习

作者: Fenng | 可以转载, 转载时务必以超链接形式标明文章原始出处和作者信息及版权声明网址: http://www.dbanotes.net/arch/facebook_arch_note.html 在 QCon 2008 (旧金山站) 上Facebook

2011-10-09 09:51:28 249

转载 学习豆瓣好榜样--网站架构

作者: Fenng | 可以转载, 转载时务必以超链接形式标明文章原始出处和作者信息及版权声明网址: http://www.dbanotes.net/arch/douban_arch.html 这次的 QCon 会议,《豆瓣网技术架构的发展历程》这个议题差不多是最

2011-10-09 09:47:28 496

原创 获得视频时间总长度的另一种方法

利用Ffmpeg获得flv视频缩略图和视频时间当时获得视频长度是采用网上的通用的获得flv视频文件长度的方法,但是这个方法只对flv视频支持,其他格式的视频获取到的值就很差了,下面在介绍一种:利用ffmpeg返回值Duration的方法,原来也想过用,但是没有解决,现在可

2011-10-08 15:11:47 2206

转载 PHP判断远程url是否有效的几种方法

前提需要判断远程URL是否有效,远程url包括远程图片,网页,视频等等元素解决办法:使用PHP解决使用file_get_contents函数,不过优缺点如果url无法访问,会出现终止程序问题使用curl返回,然后判断是否正确执行使用get_headers函数,

2011-10-08 14:54:50 531

原创 提高PHP编程效率的几点建议

用单引号代替双引号来包含字符串,这样做会更快一些。因为PHP会在双引号包围的字符串中搜寻变量,单引 号则不会,注意:只有echo能这么做,它是一种可以把多个字符串当作参数的“函数”(译注:PHP手册中说echo是语言结构,不是真正的函数,故把函 数加上了双引号)。1、如果能将

2011-10-08 12:42:27 280

转载 FirePHP介绍

FirePHP您可能不知道,但是FireBug总应该听说过吧?FirePHP基于FireBug开发,算是FireBug的插件吧,它可以把PHP输出的调试信息显示在FireBug中,不会影响到页面的显示,在线上的应用中也可以使用,是不是很爽,不过要记得只在特定的情况

2011-10-08 12:35:59 744

转载 面试题及答案

1. POST和GET分别能够传输多少数据?get:浏览器不同,处理长度不同,ie:2083,ff:65000服务器不同,处理的长度也不一定相同。post:理论上是不限长度,但受到服务器的配置限制。2. 请简述include,include_once,requir

2011-10-07 12:23:26 304

原创 PHP导出MySQL数据到Excel文件

经常会碰到需要从数据库中导出数据到Excel文件,用一些开源的类库,比如PHPExcel,确实比较容易实现,但对大量数据的支持很不好,很容易到达PHP内存使用上限。这里的方法是利用fputcsv写CSV文件的方法,直接向浏览器输出Excel文件。<?php// 输出

2011-10-07 12:20:15 211

原创 神奇的fastcgi_finish_request

当PHP运行在FastCGI模式时,PHP FPM提供了一个名为fastcgi_finish_request的方法。按照文档上的说法,此方法可以提高请求的处理速度,如果有些处理可以在页面生成完后再进行,就可以使用这个方法。听起来可能有些茫然,我们通过几个例子来说明一下:1

2011-10-07 12:14:38 374

原创 PHP学习文件操作

将数据写或读入文件,基本上分为三个步骤:1.        打开一个文件(如果存在)2.        写/读文件3.        关闭这个文件 l打开文件在打开文件文件之前,我们需要知道这个文件的路径,以及此文件是否存在。 用$_S

2011-09-06 19:49:45 385

原创 PHP学习数组

数字索引数组如同C#中的数组类似,访问数组中的每一项,可以使用数组的索引值,默认从0开始。新建数组:新建一个数组:1$phones = array('htc','moto','nokia');或:

2011-09-06 19:46:48 438

转载 自主研发搜索引擎,单机500万网页全文索引,任意检索不超过 20毫秒 .

举报 搜索引擎1.0源代码、相关说明、下载地址如下:1、GG3M.Search.Demo  进行检索,就是常说的搜索引擎网站。提供检索服务。  目前实现了:按关键词进行检索,实现了动态摘要、关键词高亮显示、自动分页、每页显示条目可自定义(默认每页显示1

2011-08-29 12:52:51 1395

转载 全文检索、数据挖掘、推荐引擎系列6---基于KMean的文本自动算法

对一系列文章进行自动聚类可以做为基于内容的推荐引擎的基础,如果要实现文本的自动聚类,首先按照本系列5中所介绍的,对文章进行分词,然后计算得出文章的术语向量表示,即求文章中每个不同的单词以其所对应的TF*IDF,具体计算方法如5中所示。目前文本自动聚类算法中,用得最多是KMean算

2011-08-27 12:53:14 433

转载 全文检索、数据挖掘、推荐引擎系列5---文章术语向量表示法

无论是要进行全文检索,还是对文章进行自动聚类分析,都需要将文章表示为术语向量(Term Vector),在Lucene内部就是通过术语向量来对文章进行索引和搜索的,但是Lucene没有向外提供合适的术语向量计算接口,所以对术语向量计算还必须我们自己来做。术语向量解述众所周

2011-08-27 12:52:44 349

转载 全文检索、数据挖掘、推荐引擎系列4---去除停止词添加同义词

Lucene对文本解析是作为全文索引及全文检索的预处理形式出现的,因此在一般的Lucene文档中,这一部分都不是重点,往往一带而过,但是对于要建立基于文本的内容推荐引擎来说,却是相当关键的一步,因此有必要认真研究一下Lucene对文解析的过程。Lucene对文本的解析对用户的

2011-08-27 12:52:12 559

转载 全文检索、数据挖掘、推荐引擎系列3---全文内容推荐引擎之中文分词

基于内容的推荐引擎有两种实现途径,一种是根据条目的元数据(可以将元数据理解为属性),另一种是根据条目的文本描述信息。本系列中将先描述基于条目描述信息的全文检索实现方式,然后描述基于元数据的内容推荐引擎实现方式。对于基于条目文本描述信息的内容推荐引擎,目前有很多资料可以参考,基

2011-08-27 12:51:43 333

转载 全文检索、数据挖掘、推荐引擎系列2---异步服务实现

正向前一篇分析的,在全文检索、数据挖掘、推荐引擎的后台系统中,通常可以提供三种类型的服务:同步服务、异步服务、后台服务。对于同步服务可以采用Web Service、XML Over HTTP或Restful服务,我在项目中就采用了Jason over HTTP,主要考虑Javas

2011-08-27 12:51:12 270

转载 全文检索、数据挖掘、推荐引擎系列1---技术架构

在后web2.0时代,简单的允许用户产生内容,连接用户组成社交网络,满足用户个性化需求,已经变成各个网站的标配,不可能成为网站的特色和竞争优势了。然而,随着用户产生内容的增多,用户与系统交互手段的丰富,用户可供选择的选项的增多,用户迫切需要一种可以处理当前信息爆炸时代的工具,可以

2011-08-27 12:49:35 402

原创 Apache Solr 初级教程(介绍、安装部署、Java接口、中文分词)

Apache Solr 介绍Solr 是什么?  Solr 是一个开源的企业级搜索服务器,底层使用易于扩展和修改的Java 来实现。服务器通信使用标准的HTTP 和XML,所以如果使用Solr 了解Java 技术会有用却不是必须的要求。  Solr 主要特性有:强大的

2011-08-26 09:41:15 1862

原创 大型数据库设计原则

陈龙兵在个人博客“将夏♂未泯‰”上曾发表过一篇博文,他依据多年来设计和使用数据库的经验,提出了一些大型数据库设计原则,现转载于此,供大家借鉴参考。全文如下:一个好的数据库产品不等于就有一个好的应用系统,如果不能设计一个合理的数据库模型,不仅会增加客户端和服务器段程序的编程和维

2011-08-25 12:53:33 326

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除