- 博客(38)
- 资源 (3)
- 收藏
- 关注
转载 cronExpression
关于cronExpression的介绍一个Cron-表达式是一个由六至七个字段组成由空格分隔的字符串,其中6个字段是必须的而一个是可选的,如下: 字段名 允许的值 允许的特殊字符 秒 0-59 , - * / 分
2012-09-29 11:52:53 1172
翻译 Tesseract限制匹配的字符集
在OCR过程中,我发现,如果能够限制匹配的字符集,那么肯定能够大大提高识别效率,但是能不能支持呢?我查了很多资料,都没有明确答案,最后,在stackoverflow终于找的了答案。翻译过来。Q:Is it possible to limit the set of characters that tesseract is looking for (e.g. search on
2012-09-19 16:41:28 6055 2
转载 python 常用包
常用的几个第三方库如下:wxPython如果你之前是 windows 程序员,用 MFC 或者 WIN32API 开发界面程序,那进入 Python 国度最好的 GUI 选择应该是 wxPython。它是 wxWidgets 的 Python Bind,与 wxWidgets 的开发完美同步,最为重要的一点是它的消息机制与 MFC 颇为相似,以前在 MFC 的经验完全可以稍作变化就
2012-09-19 15:47:18 1366
转载 在python3下用PIL做图像处理
ython Imaging Library (PIL)是python下的图像处理模块,支持多种格式,并提供强大的图形与图像处理功能。目前PIL的官方最新版本为1.1.7,支持的版本为python 2.5, 2.6, 2.7,并不支持python3,但有高手把它重新编译生成python3下可安装的exe了。这一非官方下载地址 http://www.lfd.uci.edu/~gohlk
2012-09-19 15:44:39 11012
转载 验证码识别原理浅谈--图像二值化
二值化实现方法有1.1图像灰度化-中值滤波等,同时可以实现背景的去除1.2图像灰度化-根据灰度值1.3根据图像色系范围进行二值化处理图像二值化的意思就是将图像的有效点给分离出来,然后将图片用0和1两个值进行表 示,因为我们没必要知道他们的具体色值,我们的目的就是要知道他们的具体形状,他们 的特征譬如说淘宝的验证码,和盛大的验 证码, 他们的有效点无非
2012-09-19 10:39:09 4961
转载 用户自动登录的jsp实现
一、什么是用户自动登录?对于我们的网站向已注册用户提供某些专门的服务,比如网上购物、在线下载、收费浏览等等,就会要求用户在使用这些服务之前进入登录页面,输入用户名和密码,并进行验证。如果用户经常访问我们的网站,假如每天都访问一次,或者好几次,那么用户每次都重复这些登录操作就会感到相当厌烦。通过一些简单的技术手段,我们可以让网站“记住”那些在曾经登录过的用户。当该用户下次再来访问的时
2012-09-19 10:29:53 1292
转载 pil能处理的图片 类型
原文地址 http://www.javaeye.com/wiki/Python/1371-python-graphics-library-pil-python-image-library-introduction关于PIL库的一些概念pil能处理的图片 类型 pil可以处理光栅图片(像素数据组成的的块)。通道 一个图片可以包含一到多个数据通道,如果这些通道具有相
2012-09-18 13:30:49 1737
转载 Python post、get百度(登陆)
python get百度获得搜索结果# -*- coding: cp936 -*-import urllib2,urllib,sys,io"""使用GET在百度搜索引擎上查询此例演示如何生成GET串,并进行请求."""url = "http://www.baidu.com/s"search = [('w','codemo')]getString = url + "?" + ur
2012-09-17 21:06:23 4269
转载 python发送GET或POST请求以便干一些趣事
python发送GET或POST请求以便干一些趣事适合级别:入门,中级关键字 :python, http, GET, POST, 安全, 模拟, 浏览器, 验证码,图片识别, google 1 此文不是关于黑客或安全话题的! 2 使用脚本程序发送GET或POST,这是最简单也是最常见最频繁的事情之一;那为什么我还要YY一遍呢? 因为不只是熟能生
2012-09-17 16:34:17 5558 1
转载 Python 时间处理
Python的time模块的部分翻译:一、简介time模块提供各种操作时间的函数说明:一般有两种表示时间的方式:第一种是时间戳的方式(相对于1970.1.1 00:00:00以秒计算的偏移量),时间戳是惟一的第二种以数组的形式表示即(struct_time),共有九个元素,分别表示,同一个时间戳的struct_time会因为时区不同而不同year (four dig
2012-09-17 15:20:10 3573
转载 解决 Python.h:没有那个文件或目录 错误的方法
今天在实验室的ubuntu机子上安装Eventlet,在安装依赖包greenlet时出现错误,出现编译错误。错误如下:In file included from greenlet.c:5:0:greenlet.h:8:20: 致命错误: Python.h:没有那个文件或目录编译中断。error: Setup scr
2012-09-14 09:28:06 6601
原创 Python引用模块
这样写代码健壮性最好:import sys;if not "/home/a/" in sys.path: sys.path.append("/home/a/")if not 'b' in sys.modules: b = __import__('b')else: eval('import b') b = eval('reload(b)')
2012-09-13 21:52:34 620
转载 urllib2与urllib的区别
What is the difference between urllib and urllib2 modules of Python?You might be intrigued by the existence of two separate URL modules in Python - urllib and urllib2. Even more intriguing: they
2012-09-13 08:59:34 1060
转载 python urllib从远程服务器下载文件到本地
#!/usr/bin/env python#-*-coding:utf-8-*-'#Filename:download_file.pyimport sys,osimport urllibdef urlcallback(a,b,c): """ call back function a,已下载的数据块 b,数据块的大小
2012-09-10 14:13:32 2428
转载 挑选文件夹里面宽大于300图片
import sysimport ossys.path.append('PIL')from PIL import Image as impath = '/home/hualun/桌面/img/'new_path = '/home/hualun/桌面/img2/'for x in os.listdir(path): if x.endswith('.jpg'):
2012-09-09 22:51:24 916
转载 Python程序计时
import datetimestarttime = datetime.datetime.now()#do somethingendtime = datetime.datetime.now()interval=(endtime - starttime).seconds
2012-09-09 22:36:30 1843
转载 图片蜘蛛,写来爬去凡客上的T的图片的
import osimport sysimport reimport urllibVANCAL_ITEM = re.compile(r'http://vt.vancl.com/item/(\d+).*', re.I)ITEM_PIC = re.compile(r'(http://images.vancl.com/product/.*?/small/.*?\.jpg)', re.I)
2012-09-09 22:29:38 818
转载 使用Python访问并下载网页内容
#!/usr/local/bin/python3.2import urllib.request,io,os,sysreq=urllib.request.Request("http://bbs.admin5.com/api.php?mod=js&bid=70")f=urllib.request.urlopen(req)s=f.read()s=s.decode('gbk','ignore')
2012-09-09 22:17:18 861
转载 Python os.path.walk遍历文件,搜索文件里面的内容
import os, syslistonly = Falseskipexts = ['.gif', '.exe', '.pyc', '.o', '.a','.dll','.lib','.pdb','.mdb'] # ignore binary files def visitfile(fname, searchKey): #
2012-09-09 22:15:31 5606
转载 Python 常用代码片段
1.生成随机数 import random #这个是注释,引入模块 rnd = random.randint(1,500)#生成1-500之间的随机数2.读文件 f = open("c:\\1.txt","r") lines = f.readlines()#读取全部内容 for line in
2012-09-09 22:10:01 1116
转载 用python从百度获取亚马逊的商品ID
包含两个头文件,一个是 web.py 的框架,一个是 tagparser 代码很简单,看下面: #encoding=utf-8import webimport tagparserdb = web.database(dbn='mysql',user='root', pw='', db='webpy')count=0for i in range(10000,10): url=
2012-09-07 18:29:09 1218
转载 使用Python访问并下载网页内容
#!/usr/local/bin/python3.2import urllib.request,io,os,sysreq=urllib.request.Request("http://bbs.admin5.com/api.php?mod=js&bid=70")f=urllib.request.urlopen(req)s=f.read()s=s.decode('gbk','ignore')
2012-09-07 18:24:20 620
转载 从百度MP3中批量下载某歌手的歌
#!/usr/bin/python# -*- coding: utf-8 -*-################################百度中批量下载某歌手的歌###############################import re,urllib,osdef download(author_name=u"陈奕迅",filepath="F:/downloadmusic/"
2012-09-07 18:16:54 1286
转载 初学Python
#-*-coding:gb2312-*- 文件编码#-*-coding:utf-8-*-#单行注释import os #引入模块 os.pyimport sysdef main(): print "hello world" #注意这里是用4个空格缩进 #用缩进来代表领空 而不是{} foo(5, 10) #函数调用 print "=
2012-09-07 18:13:12 658
转载 Python 一个简单的MySQLdb封装类
__author__ = 'yang'import MySQLdbclass MySQLHelper: def __init__(self,host,user,password,charset="utf8"): self.host=host self.user=user self.password=password sel
2012-09-07 17:53:57 6001
转载 抓取百度查询结果
#win python 2.7.ximport re,sys,urllib,codecsxh = urllib.urlopen("http://www.baidu.com/s?q1=123&rn=100").read().decode('utf-8') rc = re.compile(r'(?P.*?)',re.I)match = rc.finditer(xh)rcr = re.comp
2012-09-07 17:50:51 1103
转载 python 之 MySQLdb2
下载安装MySQLdblinux版本http://sourceforge.net/projects/mysql-python/ 下载,在安装是要先安装setuptools,然后在下载文件目录下,修改mysite.cfg,指定本地mysql的mysql-config文件的路径windows版本网上搜索到一个http://www.technicalbard.com/files/MySQ
2012-09-07 17:49:02 570
转载 Python 之 MySQLdb
mysql是一个优秀的开源数据库,它现在的应用非常的广泛,因此很有必要简单的介绍一下用python操作mysql数据库的方法。python操作数 据库需要安装一个第三方的模块,在http://mysql-python.sourceforge.net/有下载和文档。#-*- encoding: gb2312 -*-import os, sys, stringimport MySQLdb#
2012-09-07 17:45:52 500
转载 python中文乱码问题
字符串在Python内部的表示是unicode编码,因此,在做编码转换时,通常需要以unicode作为中间编码,即先将其他编码的字符串解码(decode)成unicode,再从unicode编码(encode)成另一种编码。 decode的作用是将其他编码的字符串转换成unicode编码,如str1.decode('gb2312'),表示将gb2312编码的字符串str1转换成unicod
2012-09-07 17:34:49 484
转载 Python 转码错误
在用Python 做一应用时,需要将预处理时需要统一编码, 在将utf8转换为gb2312 时报错: 错误原因:'gb2312' codec can't encode characteru'\xb7' in position 8061: illegal multibyte sequence 搜索后发现gb2312对一些很生僻的中文字并不支持,比如 “囧” “苶”然后自
2012-09-07 17:28:38 854
转载 python 之 json2
1.安装下载 simplejson-2.6.1.tar命令: tar -xf simplejson-2.6.1.tar 解压然后:cd simplejson-2.6.1安装命令:python setup.py install安装完成2.程序,注意编码问题import simplejsondef read_jsonfil
2012-09-07 17:21:54 637
转载 Python 之 Json
什么是json:JSON(JavaScript Object Notation) 是一种轻量级的数据交换格式。易于人阅读和编写。同时也易于机器解析和生成。它基于JavaScript Programming Language, Standard ECMA-262 3rd Edition - December 1999的一个子集。JSON采用完全独立于语言的文本格式,但是也使用了类似于C语言家
2012-09-07 11:47:46 1105
转载 python 之 format
发信人: N23 (23号), 信区: Python标 题: zz What’s New in Python 2.6 翻译 (七) -PEP 3101: 改进的字发信站: 水木社区 (Tue Oct 7 17:20:45 2008), 转信PEP 3101: 改进的字符串格式化在Python 3.0中,%操作符通过一个更强的格式化方法format()进行了增强。对str
2012-09-07 11:41:00 646
转载 python Debug 文件结束
一直用python读文件都是文本文件。用的方法是:lines=open('ft.txt')但是前两天读一个几百兆的大文件的时候,遇到了奇怪的问题,觉得是内容没有读完。定位最后读到的行,用emeditor打开,发现有一个怪字符“”。编码是“\x001a”,一查,原来是文件结束符号。一直郁闷,奇怪为啥文本文件里面有文件结束符,试了好多办法,都不行,最后经limodou指点,原来这种
2012-09-07 11:38:08 764
转载 python 之 getopt
getopt 短选项和长选项的实现方法————————————————————————————————————————————————————————————————在运行程序时,可能需要根据不同的条件,输入不同的命令行选项来实现不同的功能。目前有短选项 和长选项 两种格式。短选项格式为"-"加上单个字母选项;长选项为"--"加上一个单词。长格式是在Linux下引入的。许多Li
2012-09-07 11:29:39 1470
转载 python 之 __str__
__str__ 直接打印对象的实现方法————————————————————————————————————————————————————在python语言里,__str__一般是格式是这样的。class A:def __str__(self):return "this is in str"事实上,__st
2012-09-07 11:17:00 24652 1
转载 python 之 thread
threading.Thread Thread是threading模块中最重要的类之一,可以使用它来创建线程。有两种方式来创建线程:一种是通过继承Thread类,重写它的run方法;另一种是创建一个threading.Thread对象,在它的初始化函数(__init__)中将可调用对象作为参数传入。下面分别举例说明。先来看看通过继承threading.Thread类来创建线程的例子:
2012-09-07 11:07:14 1864
转载 python 之 yield
yield 用for循环调用可迭代的函数____________________________________________________________________包含了关键字"yield"的函数就不是普通的函数。当含有这个关键字的函数被调用的时候,这个函数在遇到yield的时候会停止运行,并且返回一个迭代器(iterator)。每次请求一个值,就会执行生成的代码
2012-09-07 11:02:54 616
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人