1、os
(1)os.path--常用来提取、分离文件名
os.path.basename('path') 提取文件基名
os.path.dirname('path') 提取路径名,去掉基名
os.path.split('path') 将基名和路径名分离
os.path.splitext('path') 同上,只不过返回的元组中基名在前,路径名在后
os.path.join('a','b','c') 将合并成'a/b/c'文件名
os.path.exists('path') 查询文件是否存在
os.path.isfile(file) 判断指定对象是否为文件
os.path.isdir(dir) 判断指定对象是否为目录
os.path.getsize(path路径) 提取文件的大小
跟多方法见os.path.[tab][tab]
(2)
os.system(cmd)--调用shell命令(不过不能获取输出,要想获取输出可使用os.popen(cmd).read()、subprocess.Popen等)
例:os.system('pwd')
(3)os.getcwp()--获取当前目录
(4)os.mkdir(dir) 创建目录
(5)os.remove(file) 删除指定文件
(6)os.rmdir(dir) 删除指定目录
(7)os.stat(file) 获取文件信息
2、sys
(1)sys.exit(n):
执行至主程序的末尾时,解释器会自动退出. 但是如果需要中途退出程序, 你可以调用sys.exit 函数, 它带有一个可选的整数参数返回给调用它的程序. 这意味着你可以在主程序中捕获对sys.exit 的调用。(注:0是正常退出,其他为不正常,可抛异常事件供捕获!)
(2)sys.argv[] 给程序提供参数,第一个参数是程序路径本身
例:
Test.py脚本内容:
import sys
print sys.argv[0]
print sys.argv[1]
print sys.argv[2]
print sys.argv[3]
[root@databak scripts]# python test.py arg1 arg2 arg3
test.py
arg1
arg2
arg3
(3)sys. path 查看模块的搜索路径
增加模块搜索路径:
1)python中动态临时增加
import sys
sys.path.append(tmppath)
2).pth文件增加
site-packages路径下增加.pth文件,文件中每行记录代表一个有效路径
3)PYTHONPATH中添加模块路径
PYTHONPATH是系统环境变量,能够被所有的python识别,比如同时安装了python2.7和python3.4
(4)sys.platform 返回当前系统平台,如:win32、Linux等。
3、urllib、urllib2
urllib2可以接受一个Request对象,并以此可以来设置一个URL的headers,但是urllib只接收一个URL。这意味着,你不能伪装你的用户代理字符串等。
urllib模块可以提供进行urlencode的方法,该方法用于GET查询字符串的生成,urllib2的不具有这样的功能。这就是urllib与urllib2经常在一起使用的原因。
(1)urllib2.urlopen(url[,data,timeout]) 用来获取网页内容
(2)urllib2.Response(url) 提供一个response,可在urllib2.urlopen中使用
(3)urllib2.urlopen(Response) 获取请求,(2)、(3)步一起用和(1)效果一样
(4)urllib.urlopen(url) 效果同(1)
获取网页内容后可用read()方法读取
a = urllib2.urlopen('www.XXX.XX')
b = a.read()
4、re
详见
python正则表达式
这里只是列出了常用模块的的常用方法,具体使用方法和案例,请谷歌