python
文章平均质量分 62
followingturing
这个作者很懒,什么都没留下…
展开
-
正则表达式实例
正则表达式实例1.验证数字:只能输入1个数字 表达式 ^\d$ 描述 匹配一个数字 匹配的例子 0,1,2,3 不匹配的例子 2.只能输入n个数字 表达式 ^\d{n}$ 例如^\d{8}$ 描述 匹配8个数字 匹配的例子 12345678,22223334,12344321 不匹配的例子 3.只能输入至少n转载 2012-11-02 14:44:38 · 2722 阅读 · 0 评论 -
Python中的异常类型
1、NameError:尝试访问一个未申明的变量>>> vNameError: name 'v' is not defined2、ZeroDivisionError:除数为0>>> v = 1/0ZeroDivisionError: int division or modulo by zero3、SyntaxError:语法错误>>> int intSyn转载 2012-10-08 13:50:00 · 697 阅读 · 0 评论 -
解决 Python.h:没有那个文件或目录 错误的方法
今天在实验室的ubuntu机子上安装Eventlet,在安装依赖包greenlet时出现错误,出现编译错误。错误如下:In file included from greenlet.c:5:0:greenlet.h:8:20: 致命错误: Python.h:没有那个文件或目录编译中断。error: Setup scr转载 2012-09-14 09:28:06 · 6673 阅读 · 0 评论 -
Python引用模块
这样写代码健壮性最好:import sys;if not "/home/a/" in sys.path: sys.path.append("/home/a/")if not 'b' in sys.modules: b = __import__('b')else: eval('import b') b = eval('reload(b)')原创 2012-09-13 21:52:34 · 642 阅读 · 0 评论 -
urllib2与urllib的区别
What is the difference between urllib and urllib2 modules of Python?You might be intrigued by the existence of two separate URL modules in Python - urllib and urllib2. Even more intriguing: they转载 2012-09-13 08:59:34 · 1083 阅读 · 0 评论 -
python urllib从远程服务器下载文件到本地
#!/usr/bin/env python#-*-coding:utf-8-*-'#Filename:download_file.pyimport sys,osimport urllibdef urlcallback(a,b,c): """ call back function a,已下载的数据块 b,数据块的大小转载 2012-09-10 14:13:32 · 2449 阅读 · 0 评论 -
Python程序计时
import datetimestarttime = datetime.datetime.now()#do somethingendtime = datetime.datetime.now()interval=(endtime - starttime).seconds转载 2012-09-09 22:36:30 · 1866 阅读 · 0 评论 -
图片蜘蛛,写来爬去凡客上的T的图片的
import osimport sysimport reimport urllibVANCAL_ITEM = re.compile(r'http://vt.vancl.com/item/(\d+).*', re.I)ITEM_PIC = re.compile(r'(http://images.vancl.com/product/.*?/small/.*?\.jpg)', re.I)转载 2012-09-09 22:29:38 · 843 阅读 · 0 评论 -
使用Python访问并下载网页内容
#!/usr/local/bin/python3.2import urllib.request,io,os,sysreq=urllib.request.Request("http://bbs.admin5.com/api.php?mod=js&bid=70")f=urllib.request.urlopen(req)s=f.read()s=s.decode('gbk','ignore')转载 2012-09-09 22:17:18 · 896 阅读 · 0 评论 -
python发送GET或POST请求以便干一些趣事
python发送GET或POST请求以便干一些趣事适合级别:入门,中级关键字 :python, http, GET, POST, 安全, 模拟, 浏览器, 验证码,图片识别, google 1 此文不是关于黑客或安全话题的! 2 使用脚本程序发送GET或POST,这是最简单也是最常见最频繁的事情之一;那为什么我还要YY一遍呢? 因为不只是熟能生转载 2012-09-17 16:34:17 · 5595 阅读 · 1 评论 -
Python post、get百度(登陆)
python get百度获得搜索结果# -*- coding: cp936 -*-import urllib2,urllib,sys,io"""使用GET在百度搜索引擎上查询此例演示如何生成GET串,并进行请求."""url = "http://www.baidu.com/s"search = [('w','codemo')]getString = url + "?" + ur转载 2012-09-17 21:06:23 · 4305 阅读 · 0 评论 -
Python 时间处理
Python的time模块的部分翻译:一、简介time模块提供各种操作时间的函数说明:一般有两种表示时间的方式:第一种是时间戳的方式(相对于1970.1.1 00:00:00以秒计算的偏移量),时间戳是惟一的第二种以数组的形式表示即(struct_time),共有九个元素,分别表示,同一个时间戳的struct_time会因为时区不同而不同year (four dig转载 2012-09-17 15:20:10 · 3648 阅读 · 0 评论 -
Python:使用正则去除HTML标签
原创转载请注明出处:利用正则式处理,不知道会不会有性能问题,没有经过太多测试。目前我有很多还是使用BeautifulSoup进行这种处理。HTML实体处理的只是用于处理一些常用的实体。# -*- coding: utf-8-*-import re##过滤HTML中的标签#将HTML中标签等信息去掉#@param htmlstr HTML字符串.def filter转载 2012-11-02 09:03:20 · 4562 阅读 · 0 评论 -
使用python过滤html标签
采集后的数据都带有'<img src="http://i4.hdfimg.com/www/images/giftrans/3d/da/7b/18414.gif" border="0"/>科研最早和一项教学为一体的现代化综合师从性省级医院在这里只要将所有带dr = re.compile(r']+>',re.S)dd = dr.sub转载 2012-11-01 21:26:26 · 9607 阅读 · 0 评论 -
python输出json时中文处理问题
转贴,非原创)json.dumps在默认情况下,对于非ascii字符生成的是相对应的字符编码,而非原始字符,例如:>>> import json>>> js = json.loads('{"haha": "哈哈"}')>>> print json.dumps(js){"haha": "\u54c8\u54c8"}解决办法很简单转载 2012-11-01 20:10:44 · 15124 阅读 · 0 评论 -
Python、Unicode和中文
Python、Unicode和中文[转]python的中文问题一直是困扰新手的头疼问题,这篇文章将给你详细地讲解一下这方面的知识。当然,几乎可以确定的是,在将来的版本中,python会彻底解决此问题,不用我们这么麻烦了。先来看看python的版本:>>> import sys>>> sys.version'2.5.1 (r251:54863, Apr 18 2007,转载 2012-11-01 15:22:04 · 1276 阅读 · 0 评论 -
Tesseract限制匹配的字符集
在OCR过程中,我发现,如果能够限制匹配的字符集,那么肯定能够大大提高识别效率,但是能不能支持呢?我查了很多资料,都没有明确答案,最后,在stackoverflow终于找的了答案。翻译过来。Q:Is it possible to limit the set of characters that tesseract is looking for (e.g. search on翻译 2012-09-19 16:41:28 · 6112 阅读 · 2 评论 -
python 常用包
常用的几个第三方库如下:wxPython如果你之前是 windows 程序员,用 MFC 或者 WIN32API 开发界面程序,那进入 Python 国度最好的 GUI 选择应该是 wxPython。它是 wxWidgets 的 Python Bind,与 wxWidgets 的开发完美同步,最为重要的一点是它的消息机制与 MFC 颇为相似,以前在 MFC 的经验完全可以稍作变化就转载 2012-09-19 15:47:18 · 1384 阅读 · 0 评论 -
在python3下用PIL做图像处理
ython Imaging Library (PIL)是python下的图像处理模块,支持多种格式,并提供强大的图形与图像处理功能。目前PIL的官方最新版本为1.1.7,支持的版本为python 2.5, 2.6, 2.7,并不支持python3,但有高手把它重新编译生成python3下可安装的exe了。这一非官方下载地址 http://www.lfd.uci.edu/~gohlk转载 2012-09-19 15:44:39 · 11037 阅读 · 0 评论 -
pil能处理的图片 类型
原文地址 http://www.javaeye.com/wiki/Python/1371-python-graphics-library-pil-python-image-library-introduction关于PIL库的一些概念pil能处理的图片 类型 pil可以处理光栅图片(像素数据组成的的块)。通道 一个图片可以包含一到多个数据通道,如果这些通道具有相转载 2012-09-18 13:30:49 · 1779 阅读 · 0 评论 -
挑选文件夹里面宽大于300图片
import sysimport ossys.path.append('PIL')from PIL import Image as impath = '/home/hualun/桌面/img/'new_path = '/home/hualun/桌面/img2/'for x in os.listdir(path): if x.endswith('.jpg'):转载 2012-09-09 22:51:24 · 1017 阅读 · 0 评论 -
Python os.path.walk遍历文件,搜索文件里面的内容
import os, syslistonly = Falseskipexts = ['.gif', '.exe', '.pyc', '.o', '.a','.dll','.lib','.pdb','.mdb'] # ignore binary files def visitfile(fname, searchKey): #转载 2012-09-09 22:15:31 · 5650 阅读 · 0 评论 -
Python 常用代码片段
1.生成随机数 import random #这个是注释,引入模块 rnd = random.randint(1,500)#生成1-500之间的随机数2.读文件 f = open("c:\\1.txt","r") lines = f.readlines()#读取全部内容 for line in转载 2012-09-09 22:10:01 · 1165 阅读 · 0 评论 -
Python 之 Json
什么是json:JSON(JavaScript Object Notation) 是一种轻量级的数据交换格式。易于人阅读和编写。同时也易于机器解析和生成。它基于JavaScript Programming Language, Standard ECMA-262 3rd Edition - December 1999的一个子集。JSON采用完全独立于语言的文本格式,但是也使用了类似于C语言家转载 2012-09-07 11:47:46 · 1129 阅读 · 0 评论 -
python 之 format
发信人: N23 (23号), 信区: Python标 题: zz What’s New in Python 2.6 翻译 (七) -PEP 3101: 改进的字发信站: 水木社区 (Tue Oct 7 17:20:45 2008), 转信PEP 3101: 改进的字符串格式化在Python 3.0中,%操作符通过一个更强的格式化方法format()进行了增强。对str转载 2012-09-07 11:41:00 · 671 阅读 · 0 评论 -
python 之 getopt
getopt 短选项和长选项的实现方法————————————————————————————————————————————————————————————————在运行程序时,可能需要根据不同的条件,输入不同的命令行选项来实现不同的功能。目前有短选项 和长选项 两种格式。短选项格式为"-"加上单个字母选项;长选项为"--"加上一个单词。长格式是在Linux下引入的。许多Li转载 2012-09-07 11:29:39 · 1495 阅读 · 0 评论 -
python Debug 文件结束
一直用python读文件都是文本文件。用的方法是:lines=open('ft.txt')但是前两天读一个几百兆的大文件的时候,遇到了奇怪的问题,觉得是内容没有读完。定位最后读到的行,用emeditor打开,发现有一个怪字符“”。编码是“\x001a”,一查,原来是文件结束符号。一直郁闷,奇怪为啥文本文件里面有文件结束符,试了好多办法,都不行,最后经limodou指点,原来这种转载 2012-09-07 11:38:08 · 789 阅读 · 0 评论 -
python 之 sqlite
年前涉及了Python调用SQLite的一些应用,一直没有时间写博客,今天准备写出来分享一下,不然再过段时间,自己就忘记了。哈哈~闲话说完,下面进入正题吧。 首先,我们需要知道几个问题: 1、在Python中是集成了SQLite数据库的,所以我们不需要安装任何的数据库或其他应用了,直接调用即可; 2、我的使用环境是:Python2.6 和 PyChar转载 2012-08-14 09:49:35 · 3029 阅读 · 0 评论 -
python 之 thread
threading.Thread Thread是threading模块中最重要的类之一,可以使用它来创建线程。有两种方式来创建线程:一种是通过继承Thread类,重写它的run方法;另一种是创建一个threading.Thread对象,在它的初始化函数(__init__)中将可调用对象作为参数传入。下面分别举例说明。先来看看通过继承threading.Thread类来创建线程的例子:转载 2012-09-07 11:07:14 · 1885 阅读 · 0 评论 -
python 之 __str__
__str__ 直接打印对象的实现方法————————————————————————————————————————————————————在python语言里,__str__一般是格式是这样的。class A:def __str__(self):return "this is in str"事实上,__st转载 2012-09-07 11:17:00 · 24752 阅读 · 1 评论 -
python 之 yield
yield 用for循环调用可迭代的函数____________________________________________________________________包含了关键字"yield"的函数就不是普通的函数。当含有这个关键字的函数被调用的时候,这个函数在遇到yield的时候会停止运行,并且返回一个迭代器(iterator)。每次请求一个值,就会执行生成的代码转载 2012-09-07 11:02:54 · 637 阅读 · 0 评论 -
Python 之 MySQLdb
mysql是一个优秀的开源数据库,它现在的应用非常的广泛,因此很有必要简单的介绍一下用python操作mysql数据库的方法。python操作数 据库需要安装一个第三方的模块,在http://mysql-python.sourceforge.net/有下载和文档。#-*- encoding: gb2312 -*-import os, sys, stringimport MySQLdb#转载 2012-09-07 17:45:52 · 523 阅读 · 0 评论 -
python 之 MySQLdb2
下载安装MySQLdblinux版本http://sourceforge.net/projects/mysql-python/ 下载,在安装是要先安装setuptools,然后在下载文件目录下,修改mysite.cfg,指定本地mysql的mysql-config文件的路径windows版本网上搜索到一个http://www.technicalbard.com/files/MySQ转载 2012-09-07 17:49:02 · 593 阅读 · 0 评论 -
抓取百度查询结果
#win python 2.7.ximport re,sys,urllib,codecsxh = urllib.urlopen("http://www.baidu.com/s?q1=123&rn=100").read().decode('utf-8') rc = re.compile(r'(?P.*?)',re.I)match = rc.finditer(xh)rcr = re.comp转载 2012-09-07 17:50:51 · 1124 阅读 · 0 评论 -
用python从百度获取亚马逊的商品ID
包含两个头文件,一个是 web.py 的框架,一个是 tagparser 代码很简单,看下面: #encoding=utf-8import webimport tagparserdb = web.database(dbn='mysql',user='root', pw='', db='webpy')count=0for i in range(10000,10): url=转载 2012-09-07 18:29:09 · 1242 阅读 · 0 评论 -
使用Python访问并下载网页内容
#!/usr/local/bin/python3.2import urllib.request,io,os,sysreq=urllib.request.Request("http://bbs.admin5.com/api.php?mod=js&bid=70")f=urllib.request.urlopen(req)s=f.read()s=s.decode('gbk','ignore')转载 2012-09-07 18:24:20 · 648 阅读 · 0 评论 -
初学Python
#-*-coding:gb2312-*- 文件编码#-*-coding:utf-8-*-#单行注释import os #引入模块 os.pyimport sysdef main(): print "hello world" #注意这里是用4个空格缩进 #用缩进来代表领空 而不是{} foo(5, 10) #函数调用 print "=转载 2012-09-07 18:13:12 · 684 阅读 · 0 评论 -
Python 一个简单的MySQLdb封装类
__author__ = 'yang'import MySQLdbclass MySQLHelper: def __init__(self,host,user,password,charset="utf8"): self.host=host self.user=user self.password=password sel转载 2012-09-07 17:53:57 · 6031 阅读 · 0 评论 -
python中文乱码问题
字符串在Python内部的表示是unicode编码,因此,在做编码转换时,通常需要以unicode作为中间编码,即先将其他编码的字符串解码(decode)成unicode,再从unicode编码(encode)成另一种编码。 decode的作用是将其他编码的字符串转换成unicode编码,如str1.decode('gb2312'),表示将gb2312编码的字符串str1转换成unicod转载 2012-09-07 17:34:49 · 512 阅读 · 0 评论 -
python 之 json2
1.安装下载 simplejson-2.6.1.tar命令: tar -xf simplejson-2.6.1.tar 解压然后:cd simplejson-2.6.1安装命令:python setup.py install安装完成2.程序,注意编码问题import simplejsondef read_jsonfil转载 2012-09-07 17:21:54 · 666 阅读 · 0 评论