python 常用的一些东西——sys、os 等 (转)

1. 常用内置函数:(不用 import 就可以直接使用)

    help(obj) 在线帮助, obj 可是任何类型 

    callable(obj) 查看一个 obj 是不是可以像函数一样调用 

    repr(obj) 得到 obj 的表示字符串,可以利用这个字符串 eval 重建该对象的一个拷贝 

    eval_r(str) 表示合法的 python 表达式,返回这个表达式 

    dir(obj) 查看 obj  name space 中可见的 name 

    hasattr(obj,name) 查看一个 obj  name space 中是否有 name 

    getattr(obj,name) 得到一个 obj  name space 中的一个 name 

    setattr(obj,name,value) 为一个 obj  name space 中的一个 name 指向 vale 这个 object 

    delattr(obj,name)  obj  name space 中删除一个 name 

    vars(obj) 返回一个 object  name space。用 dictionary 表示 

    locals() 返回一个局部 name space,  dictionary 表示 

    globals() 返回一个全局 name space,  dictionary 表示 

    type(obj) 查看一个 obj 的类型 

    isinstance(obj,cls) 查看 obj 是不是 cls  instance 

    issubclass(subcls,supcls) 查看 subcls 是不是 supcls 的子类 

2 .类型转换函数


    chr(i) 把一个 ASCII 数值, 变成字符 

    ord(i) 把一个字符或者 unicode 字符, 变成 ASCII 数值 

    oct(x) 把整数 x 变成八进制表示的字符串 

    hex(x) 把整数 x 变成十六进制表示的字符串 

    str(obj) 得到 obj 的字符串描述 

    list(seq) 把一个 sequence 转换成一个 list 

    tuple(seq) 把一个 sequence 转换成一个 tuple 

    dict(),dict(list) 转换成一个 dictionary 

    int(x) 转换成一个 integer 

    long(x) 转换成一个 long interger 

    float(x) 转换成一个浮点数 

    complex(x) 转换成复数 

    max(...) 求最大值 

    min(...) 求最小值 

    #用于执行程序的内置函数 

    #complie 如果一段代码经常要使用, 那么先编译, 再运行会更快。 

3. 和操作系统相关的调用


#   系统相关的信息模块 import sys 

    sys.argv 是一个 list, 包含所有的命令行参数

    sys.stdout sys.stdin sys.stderr 分别表示标准输入输出, 错误输出的文件对象

    sys.stdin.readline() 从标准输入读一行 sys.stdout.write("a") 屏幕输出 a 

    sys.exit(exit_code) 退出程序 

    sys.modules 是一个 dictionary,表示系统中所有可用的 module 

    sys.platform 得到运行的操作系统环境 

    sys.path 是一个 list, 指明所有查找 module,package 的路径

 


#操作系统相关的调用和操作 import os 

    os.environ 一个 dictionary 包含环境变量的映射关系 os.environ["HOME"] 可以得到环境变量 HOME 的值 

    os.chdir(dir) 改变当前目录 os.chdir('d:\outlook') 注意 windows 下用到转义 

    os.getcwd() 得到当前目录 

    os.getegid() 得到有效组 id  os.getgid() 得到组 id 

    os.getuid() 得到用户 id  os.geteuid() 得到有效用户 id 

    os.setegid os.setegid() os.seteuid() os.setuid() 

    os.getgruops() 得到用户组名称列表 

    os.getlogin() 得到用户登录名称 

    os.getenv 得到环境变量 

    os.putenv 设置环境变量 

    os.umask 设置 umask 

    os.system(cmd) 利用系统调用,运行 cmd 命令 

    操作举例: 


 os.mkdir('/tmp/xx') os.system("echo'hello'> /tmp/xx/a.txt") os.listdir('/tmp/xx'
 os.rename('/tmp/xx/a.txt','/tmp/xx/b.txt') os.remove('/tmp/xx/b.txt') os.rmdir('/tmp/xx'

      用 python 编写一个简单的 shell 


#!/usr/bin/python
import os, sys 
cmd = sys.stdin.readline() 
while cmd: 
   os.system(cmd) 
   cmd = sys.stdin.readline() 


#用 os.path 编写平台无关的程序 

    os.path.abspath("1.txt") == os.path.join(os.getcwd(), "1.txt") 

    os.path.split(os.getcwd()) 用于分开一个目录名称中的目录部分和文件名称部分。 

    os.path.join(os.getcwd(), os.pardir, 'a', 'a.doc') 全成路径名称. 

      os.pardir 表示当前平台下上一级目录的字符 .. 

    os.path.getctime("/root/1.txt")  返回 1.txt 的 ctime(创建时间) 时间戳 

    os.path.exists(os.getcwd()) 判断文件是否存在 

    os.path.expanduser('~/dir') 把~ 扩展成用户根目录 

    os.path.expandvars('$PATH') 扩展环境变量 PATH 

    os.path.isfile(os.getcwd()) 判断是否是文件名,1 是 0 否 

    os.path.isdir('c:\Python26\temp') 判断是否是目录, 1 是 0 否 

    os.path.islink('/home/huaying/111.sql') 是否是符号连接 windows 下不可用 

    os.path.ismout(os.getcwd()) 是否是文件系统安装点 windows 下不可用 

    os.path.samefile(os.getcwd(), '/home/huaying') 看看两个文件名是不是指的是同一个文件 

    os.path.walk('/home/huaying', test_fun, "a.c")  

      遍历 / home/huaying 下所有子目录包括本目录, 对于每个目录都会调用函数 test_fun. 

      例:在某个目录中,和他所有的子目录中查找名称是 a.c 的文件或目录。 

        def test_fun(filename, dirname, names): //filename 即是 walk 中的 a.c dirname 是访问的目录名称 

            if filename in names: //names 是一个 list, 包含 dirname 目录下的所有内容 

                print os.path.join(dirname, filename) 

        os.path.walk('/home/huaying', test_fun, "a.c") 

4. 文件操作

4.1打开文件

      f = open("filename", "r") r 只读 w 写 rw 读写 rb 读二进制 wb 写二进制 w + 写追加 读写文件       f.write("a") f.write(str) 写一字符串 f.writeline() f.readlines() 与下 read 类同       f.read() 全读出来 f.read(size) 表示从文件中读取 size 个字符       f.readline() 读一行, 到文件结尾, 返回空串. f.readlines() 读取全部,返回一个 list. list 每个元素表示一行,包含 "\n"\       f.tell() 返回当前文件读取位置       f.seek(off, where) 定位文件读写位置. off 表示偏移量,正数向文件尾移动,负数表示向开头移动。         where 为 0 表示从开始算起, 1 表示从当前位置算, 2 表示从结尾算.       f.flush() 刷新缓存 

4.2 关闭文件

      f.close()       

5. regular expression 正则表达式 import re

    简单的 regexp       p = re.compile("abc") if p.match("abc") : print "match"       上例中首先生成一个 pattern(模式), 如果和某个字符串匹配,就返回一个 match object       除某些特殊字符 metacharacter 元字符,大多数字符都和自身匹配。       这些特殊字符是 。^ $ * + ? {[] \ | ()     字符集合 (用 [] 表示)       列出字符, 如 [abc] 表示匹配 a 或 b 或 c, 大多数 metacharacter 在 [] 中只表示和本身匹配。例:         a = ".^$*+?{\|()"  大多数 metachar 在 [] 中都和本身匹配,但 "^[]\" 不同         p = re.compile("["+a+"]")         for i in a:             if p.match(i):                 print "[%s] is match" %i             else:                 print "[%s] is not match" %i         在 [] 中包含 [] 本身,表示 "[" 或者 "]" 匹配. 用 [Math Processing Error] 表示.         ^ 出现在 [] 的开头, 表示取反.abc 表示除了 a,b,c 之外的所有字符。^ 没有出现在开头,即于身身匹配。 


    - 可表示范围.[a-zA-Z] 匹配任何一个英文字母。[0-9] 匹配任何数字。 
         [] 中的妙用。 
                   \d [0-9] 
                   \D [^0-9] 
                   \s [\t\n\r\f\v] 
                   \S [^ \t\n\r\f\v] 
                   \w [a-zA-Z0-9_] 
                   \W [^a-zA-Z0-9_] 
                   \t 表示和 tab 匹配, 其他的都和字符串的表示法一致 
                   \x20 表示和十六进制 ascii 0x20 匹配 
                   有了 \,可以在 [] 中表示任何字符。注:单独的一个 "." 如果没有出现 [] 中,表示出了换行 \ n 以外的匹配任何字符, 类似 [^\n]. 
               regexp 的重复          
                 {m,n} 表示出现 m 个以上 (含 m 个),n 个以下 (含 n 个).  如 ab{1,3}c 和 abc,abbc,abbbc 匹配,不会与 ac,abbbc 匹配。 
                 m 是下界,n 是上界。m 省略表下界是 0,n 省略,表上界无限大。 
    * 表示 {,} + 表示 {1,} ? 表示 {0,1} 
         和最小匹配 python 都是最大匹配,如果要最小匹配,在 *,+,?,{m,n} 后面加一个?. 
                 match object 的 end 可以得到匹配的最后一个字符的位置。 
                   re.compile("a*").match('aaaa').end()     4  最大匹配 
                   re.compile("a*?").match('aaaa').end()    0  最小匹配 
               使用原始字符串 
                 字符串表示方法中用 \\ 表示字符 \. 大量使用影响可读性。 
                 解决方法:在字符串前面加一个 r 表示 raw 格式。 
                 a = r"\a" print a 结果是 \ a 
                 a = r"\"a"print a 结果是 \"a 
               使用 re 模块 
                 先用 re.compile 得到一个 RegexObject 表示一个 regexp 
                 后用 pattern 的 match,search 的方法, 得到 MatchObject 
                 再用 match object 得到匹配的位置, 匹配的字符串等信息 
                 RegxObject 常用函数: 
                   >>> re.compile("a").match("abab") 如果 abab 的开头和 re.compile("a") 匹配,得到 MatchObject 
                   <_sre.SRE_Match object at 0x81d43c8> 
                   >>> print re.compile("a").match("bbab") 
                   None 注:从 str 的开头开始匹配          
                   >>> re.compile("a").search("abab") 在 abab 中搜索第一个和 re_obj 匹配的部分 
                   <_sre.SRE_Match object at 0x81d43c8> 
                   >>> print re.compile("a").search("bbab") 
                   <_sre.SRE_Match object at 0x8184e18> 和 match() 不同, 不必从开头匹配          
                   re_obj.findall(str) 返回 str 中搜索所有和 re_obj 匹配的部分. 
                     返回一个 tuple, 其中元素是匹配的字符串. 
                 MatchObject 的常用函数 
                   m.start() 返回起始位置, m.end() 返回结束位置 (不包含该位置的字符). 
                   m.span() 返回一个 tuple 表示 (m.start(), m.end()) 
                   m.pos(), m.endpos(), m.re(), m.string() 
                     m.re().search(m.string(), m.pos(), m.endpos()) 会得到 m 本身 
                   m.finditer() 可以返回一个 iterator, 用来遍历所有找到的 MatchObject. 
                     for m in re.compile("[ab]").finditer("tatbxaxb"): 
                     print m.span() 
               高级 regexp 
                 | 表示联合多个 regexp. A B 两个 regexp,A|B 表示和 A 匹配或者跟 B 匹配. 
                 ^ 表示只匹配一行的开始行首,^ 只有在开头才有此特殊意义。 
                 $ 表示只匹配一行的结尾 
                 \A 表示只匹配第一行字符串的开头 ^ 匹配每一行的行首 
                 \Z 表示只匹配行一行字符串的结尾 $ 匹配第一行的行尾 
                 \b 只匹配词的边界 例:\binfo\b 只会匹配 "info" 不会匹配 information 
                 \B 表示匹配非单词边界 
                 示例如下: 
                   >>> print re.compile(r"\binfo\b").match("info") #使用 raw 格式 \b 表示单词边界 
                   <_sre.SRE_Match object at 0x817aa98> 
                   >>> print re.compile("\binfo\b").match("info") #没有使用 raw \b 表示退格符号 
                   None 
                   >>> print re.compile("\binfo\b").match("\binfo\b") 
                   <_sre.SRE_Match object at 0x8174948> 
               分组 (Group) 示例:re.compile("(a(b)c)d").match("abcd").groups()   ('abc', 'b')        


#!/usr/local/bin/python
import re        

 x = """ 

        name: Charles 

        Address: BUPT 

        

        name: Ann 

        Address: BUPT 

        """        

#p = re.compile(r"^name:(.*)\n^Address:(.*)\n", re.M) 
        p = re.compile(r"^name:(?P.*)\n^Address:(?P .*)\n", re.M) 
        for m in p.finditer(x): 
                print m.span() 
                print "here is your friends list" 
                print "%s, %s"%m.groups() 
      Compile Flag 
         re.compile 得到 RegxObject 时,可以有一些 flag 用来调整 RegxObject 的详细特征. 
          DOTALL, S . 匹配任意字符, 包括换行符 \ n 
          IGNORECASE, I 忽略大小写 
          LOCALES, L  \ w \W \b \B 和当前的 locale 一致 
          MULTILINE, M 多行模式,只影响 ^  $(参见上例) 
          VERBOSE, X verbose 模式 


  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值