python标准库
文章平均质量分 59
djd已经存在
······
展开
-
Python命令行解析库argparse
python标准库推荐使用argparse模块对命令行进行解析。创建解析器import argparseparser = argparse.ArgumentParser()创建一个ArgumentParser实例对象,ArgumentParser对象的参数都为关键字参数。class ArgumentParser (prog=None, usage=None,原创 2015-04-25 22:05:06 · 4881 阅读 · 0 评论 -
pdb命令行调试Python代码
1. 一个混乱的程序出于本教程的目的,让我们研究一下下面的简单程序。这个程序接收两个命令行参数,然后执行加法和减法操作。(假设用户输入的是有效值,因此代码中我们没有进行错误处理。)Python1234567891011121314import sysdef add(num1=0,原创 2016-04-27 15:45:49 · 1640 阅读 · 0 评论 -
Python3.4中filter函数,map函数和reduce函数
filter函数:filter()为已知的序列的每个元素调用给定的布尔函数,调用中,返回值为非零的元素将被添加至一个列表中[python] view plain copy >>> def f1(x): if x > 20: return True else: return False >>> l1 =原创 2016-04-15 14:23:23 · 1720 阅读 · 0 评论 -
Python3 迭代器与生成器
迭代器迭代是Python最强大的功能之一,是访问集合元素的一种方式。。迭代器是一个可以记住遍历的位置的对象。迭代器对象从集合的第一个元素开始访问,直到所有的元素被访问完结束。迭代器只能往前不会后退。迭代器有两个基本的方法:iter() 和 next()。字符串,列表或元组对象都可用于创建迭代器:>>> list=[1,2,3,4]>>> it = it原创 2016-04-15 14:42:38 · 1407 阅读 · 0 评论 -
python精确除法
在C/C++语言对于整形数执行除法会进行地板除(舍去小数部分)。例如 int a=15/10; a的结果为1。同样的在Java中也是如此,所以两个int型的数据相除需要返回一个浮点型数据的时候就需要强制类型转换,例如 float a = (float)b/c ,其中b、c都是int型数据。Python中分为3种除法:传统除法、精确除法、地板除。传统除法如果是整数原创 2016-05-12 15:07:04 · 6234 阅读 · 0 评论 -
Python输出百分比
if __name__ == '__main__': a = 0.3214323 print "%.2f%%" % (a * 100)format(数值,‘m.n%’)关于m和n的含义,和前面的一样,%表示将要数值转换成百分数。举例如下:>>> print (format(0.5,'0.1%')) 50.0% >>> pr原创 2016-05-12 16:19:39 · 1849 阅读 · 0 评论 -
python的xlsxwriter库简要分析
一、xlsxwriter 基本用法,创建 xlsx 文件并添加数据 官方文档:http://xlsxwriter.readthedocs.org/ xlsxwriter 可以操作 xls 格式文件 注意:xlsxwriter 只能创建新文件,不可以修改原有文件。如果创建新文件时与原有文件同名,则会覆盖原有文件 Linux 下安装: sudo pip i原创 2016-05-12 20:22:05 · 6960 阅读 · 0 评论 -
python中包含UTF-8编码中文的列表或字典的输出
在python 下面一个包含中文字符串的列表(list)或字典,直接使用print会出现以下的结果:dict = {"asdf": "我们的python学习"}print dict{'asdf': '\xe6\x88\x91\xe4\xbb\xac\xe7\x9a\x84python\xe5\xad\xa6\xe4\xb9\xa0'}在输出处理好的数据结构的时候很不方便,需要使原创 2016-05-26 09:33:32 · 12708 阅读 · 0 评论 -
Python按行读文件
1. 最基本的读文件方法:# File: readline-example-1.py file = open("sample.txt") while 1: line = file.readline() if not line: break pass # do something一行一行得从文件读数据,显然比较慢;不过很省内存。在我的机原创 2016-04-23 20:29:30 · 1209 阅读 · 0 评论 -
shell和python实现时间转化
Linux date命令转换时间date指定格式输出$ date +"%Y-%m-%d %H:%M:%S"2014-11-21 23:59:37将日期转换为Unix时间戳当前时间转换成unix时间戳:$ date +%s1361542433转换指定日期为Unix时间戳:$ date -d "2008-01-01 00:00:00" +%s11原创 2016-04-24 16:16:48 · 1415 阅读 · 1 评论 -
Python 文件夹及文件操作
我们经常会与文件和目录打交道,对于这些操作,python可以使用 os 及 shutill 模块,其中包含了很多操作文件和目录的函数。 os 可以执行简单的文件夹及文件操作,引入用 import os,可用 help(os) 或是 dir(os) 查看其用法。注意有些函数在os模块中,有的是在os.path模块中。 shutil 模块提供了大量的文件的高级原创 2016-04-24 17:31:00 · 4652 阅读 · 0 评论 -
#!/usr/bin/env python与#!/usr/bin/python的区别
脚本语言的第一行,目的就是指出,你想要你的这个文件中的代码用什么可执行程序去运行它,就这么简单#!/usr/bin/Python是告诉操作系统执行这个脚本的时候,调用/usr/bin下的python解释器;#!/usr/bin/env python这种用法是为了防止操作系统用户没有将python装在默认的/usr/bin路径里。当系统看到这一行的时候,首先会到env设置里查找pytho原创 2016-06-08 21:09:11 · 1123 阅读 · 0 评论 -
Python获取命令行参数
如果想对Python脚本传参数,python中对应的argc, argv(C语言的命令行参数)是什么呢?需要模块:sys参数个数:len(sys.argv)脚本名: sys.argv[0]参数1: sys.argv[1]参数2: sys.argv[2]#test.pyimport sysprint "脚本名:",sys.argv[0]fo原创 2016-06-21 12:01:16 · 1171 阅读 · 0 评论 -
python的md5和sha1加密
首先介绍一下MD5和SHA1 MD5 MD5的全称是Message-DigestAlgorithm 5(信息-摘要算法)。128位长度。目前MD5是一种不可逆算法。 具有很高的安全性。它对应任何字符串都可以加密成一段唯一的固定长度的代码。 SHA1 SHA1的全称是Secure HashAlgorithm(安全哈希算法) 。SHA1基于MD5,加密后的数据长原创 2016-06-22 14:28:57 · 1617 阅读 · 0 评论 -
python中xrange简
range 函数说明:range([start,] stop[, step]),根据start与stop指定的范围以及step设定的步长,生成一个序列。range示例: >>> range(5) [0, 1, 2, 3, 4] >>> range(1,5) [1, 2, 3, 4] >>> range(0,6,2)[0, 2, 4]xrange原创 2016-04-27 15:32:25 · 1266 阅读 · 0 评论 -
Windows下IPython的配置安装
这里简要介绍下IPython的安装: 1.下载IPython的二进制安装包,地址在这里。注意选择对应的Python版本和平台。 2.因为是Windows下的,为了方便起见。直接下载二进制包,双击安装后,IPython的安装软件会自动选择在注册表中注册的Python,并进行安装。 3.将你的Python目录下的Scripts目原创 2016-03-26 13:49:21 · 1298 阅读 · 0 评论 -
windows下面安装pip教程
打开控制台,输入“Python”,我们能够看到下面的效果: 原因很简单,是因为python.exe文件在 Python 目录下,我们还没有设置环境变量。所以我们需要手动添加环境变量:鼠标右键我的电脑 -> 属性 -> 点击高级系统设置 -> 点击环境变量 -> 点击PATH -> 在最后面加上我们的Python安装路径 -> 点击确定。用一张图来表示就是:在这个过程中需要注意原创 2016-03-26 13:40:19 · 1355 阅读 · 0 评论 -
python之分析decode、encode、unicode编码转换为汉字
decode()方法使用注册编码的编解码器的字符串进行解码。它默认为默认的字符串编码。decode函数可以将一个普通字符串转换为unicode对象。decode是将普通字符串按照参数中的编码格式进行解析,然后生成对应的unicode对象,比如在这里我们代码用的是utf-8,那么把一个字符串转换为unicode就是如下形式:s2=’哈’.decode(‘utf-8′),s2就是一个存储了’哈’字的u原创 2015-04-29 22:38:19 · 9565 阅读 · 0 评论 -
python collection模块中几种数据结构(Counter、OrderedDict、namedtup)
collection模块中有几种数据结构我们可能用得到。Counter是字典的子类,负责计数的一个字典,支持 + 加法 - 减法 & 求公共元素 | 求并集print('Counter类型的应用')c = Counter("dengjingdong")#c = Counter({'n': 3, 'g': 3, 'd': 2, 'i': 1, 'o': 1, 'e': 1, 'j':原创 2015-04-27 21:48:47 · 2218 阅读 · 0 评论 -
使用python3.4解析xml文件(sax、dom、etree)
调用sax模块处理xml文件。#重载了三个方法#处理xml,主要就是写自己的事件处理类from xml.sax import *class DengHandler(ContentHandler): def startDocument(self): print("----开始解析xml文档----") def endDocument(self):原创 2015-04-27 21:54:49 · 4313 阅读 · 0 评论 -
python time模块
我们使用time模块主要就是提取时间嵌入到程序中。所以只要掌握获取时间的几个函数即可。import timext = time.localtime()print(xt)print(" 年份 :",xt.tm_year)print(" 月份 :",xt.tm_mon)print(" 日 :",xt.tm_mday)print(" 小时数 :",xt.tm_hour)pri原创 2015-04-27 21:46:19 · 1519 阅读 · 0 评论 -
python简洁之道-----Requests库
requests是python的一个HTTP客户端库,和urllib、urllib2类似,但是urllib2的api比较复杂,比如像实现一个post或是get功能都得需要一大堆代码。今天先简单介绍一下这个库,等我看过官方文档之后,在写一个全面一点的。# -*- coding:utf8 -*-import requestr = requests.get('http://www.zh原创 2015-05-09 15:33:03 · 1569 阅读 · 0 评论 -
Python一行读入多个整数+map()函数解析
python中的输入raw_input只能读入一个数,但是有时候需要读入多个数,我们该怎么办呢,读两个数可以使用两个raw_input,但是我们如果需要读取十个数怎么办,不能使用十个raw_nput 吧。import sys num1,num2 = map(int,sys.stdin.readline().split()) print num1,num2 如果需要理解上面的代原创 2015-05-11 22:19:03 · 6591 阅读 · 0 评论 -
python对json的相关操作以及json模块的简要分析
JSON(JavaScript Object Notation) 是一种轻量级的数据交换格式。易于人阅读和编写。同时也易于机器解析和生成。JSON有两种结构:第一种就是“名称/值”对的集合。在python中相当于字典类型,在其他语言中,它被理解为对象(object),纪录(record),结构(struct),字典(dictionary),哈希表(hash table),有键列表(keye原创 2015-05-12 20:13:35 · 1800 阅读 · 0 评论 -
BeautifulSoup模块的简单使用
可以通过dir(BeautifulSoup.BeautifulSoup)查看其有什么函数,如果想知道某个函数的含义可以使用help(BeautifulSoup.BeautifulSoup.find)来查看其官方文档。可以使用pprint来整输出,使用dir和help之前一定要import BeautifulSoup。# -*- coding:utf8 -*-import urll原创 2015-05-07 20:06:22 · 2040 阅读 · 0 评论 -
python内置函数详解
数学运算abs(-5) # 取绝对值,也就是5round(2.6) # 四舍五入取整,也就是3.0pow(2, 3) # 相当于2**3,如果是pow(2, 3, 5),相当于2**3 % 5cmp(2.3, 3.2原创 2015-09-13 11:01:28 · 1125 阅读 · 0 评论 -
Python标准库 多线程与同步 (threading包)
作者:Vamei 出处:http://www.cnblogs.com/vamei 欢迎转载,也请保留这段声明。谢谢! Python主要通过标准库中的threading包来实现多线程。在当今网络时代,每个服务器都会接收到大量的请求。服务器可以利用多线程的方式来处理这些请求,以提高对网络端口的读写效率。Python是一种网络服务器的后台工作语言 (比如豆瓣网),所以多线程也就很自然原创 2015-11-09 22:47:44 · 1307 阅读 · 0 评论 -
Python信号标准库(signal包,部分os包)
作者:Vamei 出处:http://www.cnblogs.com/vamei 欢迎转载,也请保留这段声明。谢谢! 在了解了Linux的信号基础之后,Python标准库中的signal包就很容易学习和理解。signal包负责在Python程序内部处理信号,典型的操作包括预设信号处理函数,暂停并等待信号,以及定时发出SIGALRM等。要注意,signal包主要是针对UNIX平台(比如Lin原创 2015-10-31 19:24:11 · 1439 阅读 · 0 评论 -
利用Queue库实现python进程间通讯
曾经写过几个爬虫,自己维护的多线程,都是用这种方法进行的通信,创建两个队列,一个存储网址url另一个存储网页的内容,创建两个线程类,类A的run函数中做的是利用url提取网页的内容,类B的run函数中做的是从网页内容的队列中提取内容,之后进行正则表达的分析,提取去想要的数据,可以存到文件中,也可以存到数据库中,都可以. 底下的代码就是相当于一个简答的通信框架,需要的时候可以扩展原创 2015-12-21 16:11:46 · 2372 阅读 · 0 评论 -
Python--pytesseract验证码识别处理实例
(linux-ubuntu系统)安装过程pytesser 调用了 tesseract,因此需要安装 tesseract,安装 tesseract 需要安装 leptonica,否则编译tesseract 的时候出现 "configure: error: leptonica not found"。sudo apt-get install tesseract-ocr之后利用pip安原创 2016-02-25 19:13:22 · 27955 阅读 · 2 评论 -
Python集合类型的操作---set
python的set和其他语言类似, 是一个无序不重复元素集, 基本功能包括关系测试和消除重复元素. 集合对象还支持union(联合), intersection(交), difference(差)和sysmmetric difference(对称差集)等数学运算. sets 支持 x in set, len(set),和 for x in set。作为一个无序的集合,sets不记录元素转载 2016-07-20 17:45:35 · 419 阅读 · 0 评论