自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(752)
  • 资源 (1)
  • 收藏
  • 关注

转载 MySQL Query Cache 小结

本文转自:http://isky000.com/database/mysql-query-cache-summary作者:简朝阳最近经常有人问我 MySQL Query Cache 相关的问题,就整理一点 MySQL Query Cache 的内容,以供参考。顾名思义,MySQL Query Cache 就是用来缓存和 Query 相关的数据的。具体来说,Query

2011-12-26 10:57:09 963

转载 MySQL Query Profile 简单使用

MySQL Query Profile MySQL 5.0.37 以上开始支持 MySQL Query Profiler, 可以查询到此 SQL 会执行多少时间, 并看出 CPU/Memory 使用量, 执行过程中 System lock, Table lock 花多少时间等等.详细可以参见官方文档:Using the New MySQL Query Profiler启动

2011-12-25 21:02:44 971

转载 Spark与Hadoop计算模型比较分析

本文转自http://blog.csdn.net/datascientist/article/details/7089127最近很多人都在讨论Spark这个貌似通用的分布式计算模型,国内很多机器学习相关工作者都在研究和使用它。Spark是一个通用的并行计算框架,由UCBerkeley的AMP实验室开发。那么Spark和Hadoop有什么不同呢?1

2011-12-22 11:41:40 2202

转载 What does functools.wraps do?

When you use a decorator, you're replacing one function with another. In other words, if you have a decoratordef logged(func): def with_logging(*args, **kwargs): print func.__name__ + "

2011-12-16 21:37:38 2037

转载 并行编程方式:OpenMP + MPI +Mapreduce

http://redtreewood.blogspot.com/2009/10/openmp-mpi-mapreduce.htmlOpenMP:OpenMp是线程级别的,共享是存储,只适应用于共享总线与内存,单一操作系统映像的SMP机器和DSM机器。可扩展性比较差,对机器的要求比较高。一般双核的机器(很多CPU共享内存条)适合用OpenMP,可以提高一定的运行速度。这个在科学计

2011-12-16 09:02:07 3292

转载 SqlAlchemy: (OperationalError) (2006, ‘MySQL server has gone away’)

What is this problem about:This is actually MySQL error message. It means that there are no MySQLconnections anymore.By MySQL default, idling database connections will be closed after 8 hours. N

2011-12-14 23:39:46 3963

原创 MYSQL INNODB中GAP LOCK引起死锁的问题

先了解一下什么是GAP LOCK在INNODB中,record-level lock大致有三种:Record, Gap, and Next-KeyLocks。简单的说,RECORDLOCK就是锁住某一行记录;而GAPLOCK会锁住某一段范围中的记录;NEXT-KEYLOCK则是前两者加起来的效果。下面是MYSQL官方文档中相关内容的链接http://dev.mysql.com/doc/

2011-12-13 15:27:44 11029 1

转载 A Comparision of Approaches to Large-Scale Data Analysis(译)

作者:Andrew Pavlo &Erik Paulson etc. 2009-6原文:http://db.csail.mit.edu/pubs/benchmarks-sigmod09.pdf译者:phylips@bmy 2011-10-4译文:http://duanple.blog.163.com/blog/static/7097176720119701941950/

2011-12-12 11:27:28 2445

转载 多些时间能少写些代码

我在我的微博上说过这样一段话,我想在这里把我的这个观点阐述地更完整一些。@左耳朵耗子:聪明的程序员使用50%-70%的时间用来思考,尝试和权衡各种设计和实现,而用30% – 50%的时间是在忙碌着编码,调试和测试。聪明的老板也会让团队这样做。而傻逼的老板,苦逼的程序员会拿出来100%-150%的时间来忙着赶进度,返工,重构,fix 大量的bug… 所以, 越差的团队一般会越忙,而且还忙

2011-12-04 21:17:02 799

转载 持续集成简介

想起我刚毕业后,进入一家以软件外包为主的外企做开发。它使用传统的瀑布式的软件开发流程,没有使用任何的敏捷实践。我每天上班打开电脑,拿到自己的任务,然后从版本控制更新代码,打开工程按下Build,准备进行今天的开发任务。突然发现Build失败(通常是编译不过),大喊一声“谁Break Build啦”,也没有人响应,自己一个人郁闷,接着查看是哪些文件导致编译失败,找到最后的提交人,让他去Fix Bui

2011-12-04 20:56:11 872

原创 Cygwin下使用python时报错找不到文件

在CYGWIN下,虽然号称可以把WINDOWS环境完全模拟成*NUX环境操作,可是有的时候还会出一些问题。就比如上面这样,其实两个路径是一样的,只不过一个是WINDOWS下的格式路径,另一个是CYGWIN下进行目录 结构转换后的路径,执行时一个成功,一个失败。目录下内容可以参看下图:下面是我在一个技术讨论群里给出的原因:王海  11:08:55我的PYTHON2.7是在

2011-11-29 11:48:17 4373

转载 什么是CPC,CPL,CPM,CPL,CPS,PPC...广告

一个网络媒体(网站)会包含有数十个甚至成千上万个页面,站点为获得生存,一般都需要在站点投放网络广告。网络广告所投放的位置和价格就牵涉到特定的页面以及浏览人数的多寡。这好比平面媒体(如报纸)的“版位”、“发行量”,或者电波媒体(如电视)的“时段”、“收视率”的概念。什么是CPL广告?CPL(Cost Per Leads):以搜集潜在客户名单多少来收费;即每次通过特

2011-11-29 10:10:05 2382

转载 Python模块学习 -- pickle, cPickle 对象序列化/反序列化

上次学习过marshal模块用于序列化和反序列化,但marshal的功能比较薄弱,只支持部分内置数据类型的序列化/反序列化,对于用户自定义的类型就无能为力,同时marshal不支持自引用(递归引用)的对象的序列化。所以直接使用marshal来序列化/反序列化可能不是很方便。还好,python标准库提供了功能更加强大且更加安全的pickle和cPickle模块。cPickle模块是使用C语言

2011-11-28 14:33:48 1613

转载 Python模块学习 -- StringIO, cStringIO 内存文件

StringIO的行为与file对象非常像,但它不是磁盘上文件,而是一个内存里的“文件”,我们可以将操作磁盘文件那样来操作StringIO。一个简单的例子,让你对StringIO有一个感性的认识:#coding=gbk import StringIO, cStringIO, sys s = StringIO.StringIO("JGood is a handsome boy")s.w

2011-11-28 14:30:12 2793

转载 Logging模块的简单使用

以前看过,但一直认为很复杂。象 NewEdit 都是自已写的日志处理。其实 logging 做得很好,也不是很复杂,只要看明白例子。在新发布的crawl 2.1.1中使用了logging,下面把它的使用代码写出来,很简单:def initlog(): import logging logger = logging.getLogger() hdlr =

2011-11-24 17:27:18 991

转载 Python doctest

>>> def median(pool):    '''Statistical median to demonstrate doctest.    >>> median([2, 9, 9, 7, 9, 2, 4, 5, 8])    7    ''' #代码的文档,功能说明。如果运行以上参数,期望结果是7    copy = sorted(pool)    size = l

2011-11-24 17:18:29 3917

转载 Python 使用 subprocess 调用外部命令

从 Python 2.4 开始,Python 引入 subprocess 模块来管理子进程,以取代一些旧模块的方法:如os.system、os.spawn、os.popen、popen2.*、commands.*。subprocess 不但可以调用外部的命令作为子进程,而且可以连接到子进程的 input/output/error 管道,获取相关的返回信息。使用 subprocess 模

2011-11-23 10:01:25 4078

转载 java是编译型的还是解释型的

Java这个语言很非凡。 一、你可以说它是编译型的。因为所有的Java代码都是要编译的,.java不经过编译就什么用都没有。 二、你可以说它是解释型的。因为java代码编译后不能直接运行,它是解释运行在JVM上的,所以它是解释运行的,那也就算是解释的了。 三、但是,现在的JVM为了效率,都有一些JIT优化。它又会把.class的二进制代码编译为本地的代码直接运行,所以,又是编译的。

2011-11-14 09:40:19 5276 2

转载 CRM整体解决--分析型、运营型以及协作型CRM

CRM整体解决方案---分析型、运营型以及协作型CRMCRM是为了提高企业的效益,将原来的以产品为中心,转变为以客户为中心的产物。随着各类类似产品供应商的增加,竞争越来越激烈,客户选择的机会越来越大,在很多情况下,客户也不知道最后该选谁家的产品或者服务。只能靠看广告、找朋友咨询、或者寻找品牌好、服务好的厂商的产品。所以,很多厂商为了提高知名度,不得不花费大量的资金打广告,建立“品牌”。

2011-11-10 15:05:25 6849

转载 GET和POST的不同

web开发中Post和Get的区别,主要有这么几点,另外在开发中也给些建议 1.Get是从服务器上获取数据,Post是向服务器传送数据。 2.Get是把参数数据队列加到提交表单的Action属性所指的URL中,值和表单内各个字段一一对应,在URL中可以看到。Post是通过HTTP post机制,将表单内各个字段与其内容放置在HTML header内一起传送到Action属性所指向的URL地

2011-11-09 14:38:47 937 1

转载 常用字符集编码详解:ASCII 、GB2312、GBK、GB18030、UTF-8、unicode

ASCII ASCII码是7位编码,编码范围是0x00-0x7F。ASCII字符集包括英文字母、阿拉伯数字和标点符号等字符。其中0x00-0x20和0x7F共33个控制字符。只支持ASCII码的系统会忽略每个字节的最高位,只认为低7位是有效位。HZ字符编码就是早期为了在只支持7位ASCII系统中传输中文而设计的编码。早期很多邮件系统也只支持ASCII编码,为了传输中文邮件必须使用B

2011-11-09 11:02:18 2342

转载 mysql 通配符

MySQL提供标准的SQL模式匹配,以及一种基于象Unix实用程序如vi、grep和sed的扩展正则表达式模式匹配的格式。SQL的模式匹配允许你使用“_”匹配任何单个字符,而“%”匹配任意数目字符(包括零个字符)。在 MySQL中,SQL的模式缺省是忽略大小写的。下面显示一些例子。注意在你使用SQL模式时,你不能使用=或!=;而使用LIKE或NOT LIKE比较操作符。为了找出以“b”开头

2011-11-07 19:52:58 1904

转载 python __str__(self) __unicode__(self)

__str__Model.__str__()__str__() is a Python "magic method" that defines what should be returned if you call str() on the object. Django uses str(obj) (or the related function, unicode(obj) --

2011-11-07 16:27:47 9580 1

转载 Python特殊语法:filter、map、reduce、lambda、yield

Python内置了一些非常有趣但非常有用的函数,充分体现了Python的语言魅力!filter(function, sequence):对sequence中的item依次执行function(item),将执行结果为True的item组成一个List/String/Tuple(取决于sequence的类型)返回:>>> def f(x): return x % 2 != 0 and x %

2011-11-04 17:27:09 5389

转载 Iterator 和 Generator的学习心得

Iterator是迭代器的意思,它的作用是一次产生一个数据项,直到没有为止。这样在 for 循环中就可以对它进行循环处理了。那么它与一般的序列类型(list, tuple等)有什么区别呢?它一次只返回一个数据项,占用更少的内存。但它需要记住当前的状态,以便返回下一数据项。它是一个有着next()方法的对象。而序列类型则保存了所有的数据项,它们的访问是通过索引进行的。使用Iterator的好

2011-11-01 22:40:48 1316

转载 Understanding Python's "for" statement

One of the things I noticed when skimming through the various reactions to my recent “with”-article is that some people seem tohave a somewhat fuzzy understanding of Python’s other block statement,the

2011-11-01 22:34:02 949

转载 python中的 new-style class 及其实例详解

1.1. 5.2 new-style Class 及其实例前面我提到 python 2.2 中引入了 new-style 对象模型. new-style class 及其实例与 Classic class 一样, 都是顶级对象。 它们可以拥有任意的属性, 通过调用类对象生成该类的一个实例对象. 在这一小节,我来向大家揭示新的对象模型及传统对象模型的不同.从 python 2.2

2011-11-01 22:18:26 2982

转载 学习python的利器-ipython

什么是ipython?ipython是python交互式shell, 它支持代码自动补全,支持高亮,支持shell命令;我个人觉得ipython最大的好处就是代码自动补全(同时它会列出模块里的类、函数、变量,这样对于学习某一个模块太有帮助了),如图:在敲urllib2.的时候按下tab键,就给你列出urllib2模块的所有类、函数、方法了安装ipython:对于ubuntu

2011-11-01 21:51:15 24236 1

转载 python rpyc 远程调用

rpyc (Remote Python Call)为分布式计算环境提供了优良的基础平台。 使用rpyc编写c/s结构程序,完全不用考虑老式的socket编程,现在只用编写简单的3、5行代码即可完成以前的数千行代码的功能。以简单实例讲解:服务端:# coding:utf-8from rpyc import Servicefrom rpyc.utils.serverimpor

2011-11-01 21:30:42 14315 1

原创 python __import__简介

下面先看个小例子[wanghai01@tc-crm-rd03 test]$ cat a.pydef func1():    print 'in a.func1'[wanghai01@tc-crm-rd03 test]$ cat c.py package = 'test'module = 'a'def func2():    p = __import_

2011-11-01 11:45:52 13265

转载 Python中的pprint和pformat简介

pprint模块中使用的格式化可以按照一种格式正确的显示数据, 这种格式即可被解析器解析, 又很易读. 输出保存在一个单行内, 但如果有必要, 在分割多行数据时也可使用缩进表示.import sysimport pprintpprint.pprint(sys.path)运行结果:[ 'C:\\WINDOWS\\system32\\python26.zip

2011-11-01 10:49:57 7044

转载 软件测试类型知多少?

软件测试的类型多种多样,测试类型与被测软件的测试需求相关。对于初学者,需要了解最常见的测试类型,也有必要了解其他的测试类型,作为进一步提高的目标。 以下转载了比较齐全的测试类型,请那位朋友帮助把全文翻译一下。黑盒测试(Black box testing)not based on any knowledge of internal design or code. Tests

2011-11-01 09:47:36 1721

转载 mysql数据库中分区的概念

RANGE 分区:基于属于一个给定连续区间的列值进行分配。。CREATE TABLE employees (    id INT NOT NULL,    fname VARCHAR(30),    lname VARCHAR(30),    hired DATE NOT NULL DEFAULT '1970-01-01',    separated DATE NO

2011-10-29 15:05:44 1027

转载 python的模块base64

base64模块真正用的上的方法只有8个,分别是encode, decode, encodestring, decodestring, b64encode,b64decode, urlsafe_b64decode,urlsafe_b64encode。他们8个可以两两分为4组,encode,decode一组,专门用来编码和 解码文件的,也可以对StringIO里的数据做编解码;encodestrin

2011-10-23 13:52:45 1651

转载 OO设计原则总结

什么是设计原则? 设计原则是基本的工具,应用这些规则可以使你的代码更加灵活、更容易维护,更容易扩展。基本原则 封装变化Encapsulate what varies. 面向接口编程而非实现 Code to an interface rather than

2011-10-18 13:48:39 1605

转载 python list排序

很多时候,我们需要对List进行排序,Python提供了两个方法对给定的List L进行排序,方法1.用List的成员函数sort进行排序方法2.用built-in函数sorted进行排序(从2.4开始)这两种方法使用起来差不多,以第一种为例进行讲解:从Pyt

2011-10-18 09:49:56 13557

原创 Python SQLAlchemy

下面是一些学习链接一篇比较简单的博客讲解http://gashero.yeax.com/?p=6#id13官方文档http://www.sqlalchemy.org/docs/还有本书叫做Essential SQLAlchemy

2011-10-14 10:59:36 1620

转载 Python: pydoc 和 distutils 模块

pydocKa-Ping Yee 曾创建了一个相当著名的模块,名叫 pydoc (比较而言: pydoc 可以做到perldoc 所能做的任何事,并且做得更好、更漂亮:-)。对于Python 2.1 来说,pydoc (以及它支持的inspect )是标准库的一部分。而对

2011-10-11 17:36:32 2200

原创 使用Sqoop在HDFS和RDBMS之间导数据

SQOOP是一款开源的工具,主要用于在HADOOP与传统的数据库间进行数据的传递,下面从SQOOP用户手册上摘录一段描述Sqoopis a tool designed to transfer data between Hadoop and relational databas

2011-10-10 20:44:28 3018

转载 Python中的property()

大家也许知道C#中提供了属性Property这个概念,让我们在对私有成员赋值、获取时更加方便,而不用像C++分别定义set*和get*两个函数,在使用时也就像直接使用变量一样。今天突然发现Python中竟然也提供了如此类似的方法,感到甚为亲切,发上来大家一起讨论一下,有不妥的

2011-10-10 16:42:10 1401 1

WINDOWS中CMD命令大全下载

WINDOWS中CMD命令大全下载。平时进行操作可以参考一下 。

2008-11-02

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除