一.文件存取操作
文件的打开模式
file 对象使用 open 函数来创建,下表列出了 file 对象常用的函数:
序号 | 方法及描述 |
---|---|
1 | 关闭文件。关闭后文件不能再进行读写操作。 |
2 | 刷新文件内部缓冲,直接把内部缓冲区的数据立刻写入文件, 而不是被动的等待输出缓冲区写入。 |
3 | 返回一个整型的文件描述符(file descriptor FD 整型), 可以用在如os模块的read方法等一些底层操作上。 |
4 | 如果文件连接到一个终端设备返回 True,否则返回 False。 |
5 | 返回文件下一行。 |
6 | 从文件读取指定的字节数,如果未给定或为负则读取所有。 |
7 | 读取整行,包括 "\n" 字符。 |
8 | 读取所有行并返回列表,若给定sizeint>0,返回总和大约为sizeint字节的行, 实际读取值可能比 sizeint 较大, 因为需要填充缓冲区。 |
9 | 设置文件当前位置 |
10 | 返回文件当前位置。 |
11 | 从文件的首行首字符开始截断,截断文件为 size 个字符,无 size 表示从当前位置截断;截断之后 V 后面的所有字符被删除,其中 Widnows 系统下的换行代表2个字符大小。 |
12 | 将字符串写入文件,没有返回值。 |
13 | 向文件写入一个序列字符串列表,如果需要换行则要自己加入每行的换行符。 |
>>> f=open('D:\\python3.6\\word.txt')
>>> f.read(3)
'123'
>>> f.read(10)
':小甲鱼工作室\n22'
>>> f.tell()
21
>>> f.seek(0,0)
0
>>> f.readline()
'123:小甲鱼工作室\n'
>>> f.read()
'222:是的\n33:haha'
>>> f.seek(0,0)
0
>>> f.read()
'123:小甲鱼工作室\n222:是的\n33:haha'
>>> f.tell()
38
>>>
>>> f.seek(0,0)
0
>>> for each_line in f:
print(each_line)
123:小甲鱼工作室
222:是的
33:haha
>>> f=open('D:\\python3.6\\word.txt','w')
>>> f.write('yuci')
4
>>> f.close()
二.os模块
序号 | 方法及描述 |
---|---|
1 | 检验权限模式 |
2 | 改变当前工作目录 |
3 | 设置路径的标记为数字标记。 |
4 | 更改权限 |
5 | 更改文件所有者 |
6 | 改变当前进程的根目录 |
7 | 关闭文件描述符 fd |
8 | os.closerange(fd_low, fd_high) 关闭所有文件描述符,从 fd_low (包含) 到 fd_high (不包含), 错误会忽略 |
9 | 复制文件描述符 fd |
10 | 将一个文件描述符 fd 复制到另一个 fd2 |
11 | 通过文件描述符改变当前工作目录 |
12 | 改变一个文件的访问权限,该文件由参数fd指定,参数mode是Unix下的文件访问权限。 |
13 | 修改一个文件的所有权,这个函数修改一个文件的用户ID和用户组ID,该文件由文件描述符fd指定。 |
14 | 强制将文件写入磁盘,该文件由文件描述符fd指定,但是不强制更新文件的状态信息。 |
15 | os.fdopen(fd[, mode[, bufsize]]) 通过文件描述符 fd 创建一个文件对象,并返回这个文件对象 |
16 | 返回一个打开的文件的系统配置信息。name为检索的系统配置的值,它也许是一个定义系统值的字符串,这些名字在很多标准中指定(POSIX.1, Unix 95, Unix 98, 和其它)。 |
17 | 返回文件描述符fd的状态,像stat()。 |
18 | 返回包含文件描述符fd的文件的文件系统的信息,像 statvfs() |
19 | 强制将文件描述符为fd的文件写入硬盘。 |
20 | 裁剪文件描述符fd对应的文件, 所以它最大不能超过文件大小。 |
21 | 返回当前工作目录 |
22 | 返回一个当前工作目录的Unicode对象 |
23 | 如果文件描述符fd是打开的,同时与tty(-like)设备相连,则返回true, 否则False。 |
24 | 设置路径的标记为数字标记,类似 chflags(),但是没有软链接 |
25 | 修改连接文件权限 |
26 | 更改文件所有者,类似 chown,但是不追踪链接。 |
27 | 创建硬链接,名为参数 dst,指向参数 src |
28 | 返回path指定的文件夹包含的文件或文件夹的名字的列表。 |
29 | 设置文件描述符 fd当前位置为pos, how方式修改: SEEK_SET 或者 0 设置从文件开始的计算的pos; SEEK_CUR或者 1 则从当前位置计算; os.SEEK_END或者2则从文件尾部开始. 在unix,Windows中有效 |
30 | 像stat(),但是没有软链接 |
31 | 从原始的设备号中提取设备major号码 (使用stat中的st_dev或者st_rdev field)。 |
32 | 以major和minor设备号组成一个原始设备号 |
33 | 递归文件夹创建函数。像mkdir(), 但创建的所有intermediate-level文件夹需要包含子文件夹。 |
34 | 从原始的设备号中提取设备minor号码 (使用stat中的st_dev或者st_rdev field )。 |
35 | 以数字mode的mode创建一个名为path的文件夹.默认的 mode 是 0777 (八进制)。 |
36 | 创建命名管道,mode 为数字,默认为 0666 (八进制) |
37 | os.mknod(filename[, mode=0600, device]) |
38 | 打开一个文件,并且设置需要的打开选项,mode参数是可选的 |
39 | 打开一个新的伪终端对。返回 pty 和 tty的文件描述符。 |
40 | 返回相关文件的系统配置信息。 |
41 | 创建一个管道. 返回一对文件描述符(r, w) 分别为读和写 |
42 | os.popen(command[, mode[, bufsize]]) 从一个 command 打开一个管道 |
43 | 从文件描述符 fd 中读取最多 n 个字节,返回包含读取字节的字符串,文件描述符 fd对应文件已达到结尾, 返回一个空字符串。 |
44 | 返回软链接所指向的文件 |
45 | 删除路径为path的文件。如果path 是一个文件夹,将抛出OSError; 查看下面的rmdir()删除一个 directory。 |
46 | 递归删除目录。 |
47 | 重命名文件或目录,从 src 到 dst |
48 | 递归地对目录进行更名,也可以对文件进行更名。 |
49 | 删除path指定的空目录,如果目录非空,则抛出一个OSError异常。 |
50 | 获取path指定的路径的信息,功能等同于C API中的stat()系统调用。 |
51 | os.stat_float_times([newvalue]) |
52 | 获取指定路径的文件系统统计信息 |
53 | 创建一个软链接 |
54 | 返回与终端fd(一个由os.open()返回的打开的文件描述符)关联的进程组 |
55 | 设置与终端fd(一个由os.open()返回的打开的文件描述符)关联的进程组为pg。 |
56 | os.tempnam([dir[, prefix]]) Python3 中已删除。返回唯一的路径名用于创建临时文件。 |
57 | os.tmpfile() Python3 中已删除。返回一个打开的模式为(w+b)的文件对象 .这文件对象没有文件夹入口,没有文件描述符,将会自动删除。 |
58 | os.tmpnam() Python3 中已删除。为创建一个临时文件返回一个唯一的路径 |
59 | 返回一个字符串,它表示与文件描述符fd 关联的终端设备。如果fd 没有与终端设备关联,则引发一个异常。 |
60 | 删除文件路径 |
61 | 返回指定的path文件的访问和修改的时间。 |
62 | os.walk(top[, topdown=True[, οnerrοr=None[, followlinks=False]]]) 输出在文件夹中的文件名通过在树中游走,向上或者向下。 |
63 | 写入字符串到文件描述符 fd中. 返回实际写入的字符串长度 |
>>> import os
>>> os.getcwd()#当前目录
'D:\\python3.6_更新'
>>> os.chdir('D:\\python3.6')#更换目录
>>> os.getcwd()
'D:\\python3.6'
>>> os.listdir('D:\\python3.6')#把目录下的内容显示出来
['computePai.py', 'divnum.py', 'Ftem.py', 'month1.py', 'quadratic1.py', 'reverse1.py', 'sum2.py', 'test1.py', 'tree1.py', 'turtle1.py', 'word.txt']
>>> os.mkdir('D:\\python3.6\\A')#新建目录
>>> os.mkdir('D:\\python3.6\\A\\B')
>>> os.rmdir('D:\\python3.6\\A\\B')#如果目录非空,则rmdir目录会报错
Traceback (most recent call last):
File "<pyshell#11>", line 1, in <module>
os.rmdir('D:\\python3.6\\A\\B')
OSError: [WinError 145] 目录不是空的。: 'D:\\python3.6\\A\\B'
>>> os.remove('D:\\python3.6\\A\\B\\test.txt')#要先删除目录下的文件
>>> os.rmdir('D:\\python3.6\\A\\B')#再删除B目录
>>> os.system('cmd')#打开cmd
-1073741510
>>> os.system('calc')#打开计算机
三.path
>>> os.path.basename('D:\\python3.6\\sum2.py')
'sum2.py'
>>> os.path.join('A','B')
'A\\B'
>>> os.path.join('D:\\','A','B')
'D:\\A\\B'
>>> os.path.split('D:\\A\\B\\word.txt')
('D:\\A\\B', 'word.txt')
>>> os.path.splitext('D:\\A\\B\\word.txt')
('D:\\A\\B\\word', '.txt')
import time
>>> time.gmtime(os.path.getatime('D:\\python3.6\\A\\B\\test.txt'))#gmtime格林时间
time.struct_time(tm_year=2018, tm_mon=3, tm_mday=5, tm_hour=12, tm_min=12, tm_sec=32, tm_wday=0, tm_yday=64, tm_isdst=0)
>>> time.localtime(os.path.getatime('D:\\python3.6\\A\\B\\test.txt'))#上次访问时间
time.struct_time(tm_year=2018, tm_mon=3, tm_mday=5, tm_hour=20, tm_min=12, tm_sec=32, tm_wday=0, tm_yday=64, tm_isdst=0)
>>> time.localtime(os.path.getmtime('D:\\python3.6\\A\\B\\test.txt'))#修改时间
time.struct_time(tm_year=2018, tm_mon=3, tm_mday=5, tm_hour=20, tm_min=16, tm_sec=38, tm_wday=0, tm_yday=64, tm_isdst=0)
>>> time.localtime(os.path.getctime('D:\\python3.6\\A\\B\\test.txt'))#创建时间
time.struct_time(tm_year=2018, tm_mon=3, tm_mday=5, tm_hour=20, tm_min=12, tm_sec=32, tm_wday=0, tm_yday=64, tm_isdst=0)
>>>
exists(path)判断指定路径是否存在
isabs(path)判断指定路径是否是绝对路径
isdir(path) 判断指定路径是否存在且是一个目录
isfile(path)判断指定路径是否存在且是一个文件
islink(path)
ismount(path)
samefile(path1,path2)
四.pickle模块
pickling:存放,将对象转换成二进制的过程
unpickling:读取,将二进制转换成对象的过程
>>> import pickle
>>> my_list=[123,3,14,'xiaojiayu',['another list']]
>>> pickle_file=open('my_list.pkl','wb')#二进制写入形式
>>> pickle.dump(my_list,pickle_file)
>>> pickle_file.close()
>>> import os
>>> os.getcwd()
'D:\\python3.6_更新'
#读取
>>> pickle_file=open('my_list.pkl','rb')
>>> my_list2=pickle.load(pickle_file)
>>> print(my_list2)
[123, 3, 14, 'xiaojiayu', ['another list']]
>>>
五.编码
1.ASCII码
7个二进制位编码
表示128个字符
ord和chr提供ASCII的转换
>>> ord('A')
65
>>> ord('a')
97
>>> chr(65)
'A'
>>> chr(97)
'a'
>>>
2.Unicode编码
跨语言,跨平台
统一且唯一的二进制编码
每个字符两个字节长
65536个字符的编码空间
3.UTF-8
可变长度的Unicode
4.在python中字符串是未编码的
可以用encode进行编码
用decode进行解码
举例:
>>> s='中文字符串'
>>> bs=s.encode('utf-8')
>>> bs
b'\xe4\xb8\xad\xe6\x96\x87\xe5\xad\x97\xe7\xac\xa6\xe4\xb8\xb2'
>>> bs.decode('utf-8')
'中文字符串'
>>>
、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、
文件实例1:绘制五角星
data.txt中的数据:
300,0,144,1,0,0
300,0,144,0,1,0
300,0,144,0,0,1
300,0,144,1,1,0
300,0,108,0,1,1
184,0,72,1,0,1
184,0,72,0,0,0
184,0,72,0,0,0
184,0,72,0,0,0
代码:
import turtle
def main():
turtle.title('数据驱动的动态路径绘制')
turtle.setup(800,600,0,0)
#设置画笔
pen=turtle.Turtle()#默认位置为窗口的原点
pen.color('red')
pen.width(5)
pen.shape('turtle')
pen.speed(5)
#读取数据文件
result=[]
file=open('data.txt','r')
for line in file:
result.append(list(map(float,line.split(','))))
print(result)
#动态绘制
for i in range(len(result)):
pen.color((result[i][3],result[i][4],result[i][5]))
pen.fd(result[i][0])#沿着当前位置向前移动...距离
if result[i][1]:
pen.rt(result[i][2])
else:
pen.lt(result[i][2])
pen.goto(0,0)
if __name__=='__main__':
main()
、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、
文件操作之实例二:
输入:电话簿、邮箱地址簿文件
处理:将两个文件内容进行合并
输出:合并后包含电话和邮箱地址簿的文件
两个文件的内容分别预先存入:
addressBook.txt中
姓名 邮箱
王颐笳 57320091@qq.com
李斯 12211212@qq.com
王五 949495968@qq.com
桑迪 wqweqe@163.com
TelBook.txt中
姓名 电话号码
王颐笳 13691177890
张三 135329293939
李斯 15811589981
桑迪 13010026896
代码:(待修改)
'''
输入:电话簿、邮箱地址簿文件
处理:将两个文件内容进行合并
输出:合并后包含电话和邮箱地址簿的文件
'''
'''
程序的步骤
一:打开文件、读取文件
二:分别获取文件中的信息,到两个列表1和列表2
三:建立合并用的空列表3,完成列表1和列表2的信息合并操作到列表3中
四:将列表3中的信息写入到新文件
五:关闭所有打开的文件
'''
def main():
ftele1=open('TelBook.txt','rb')
ftele2=open('addressBook.txt','rb')
ftele1.readline()#跳过第一行
ftele2.readline()
lines1=ftele1.readlines()
lines2=ftele2.readlines()
list1_name=[]
list1_tele=[]
list2_name=[]
list2_email=[]
for line in lines1:
elements=line.split()
list1_name.append(str(elements[0].decode('gbk')))
list1_tele.append(str(elements[1].decode('gbk')))
for line in lines2:
elements = line.split()
list2_name.append(str(elements[0].decode('gbk')))
list2_email.append(str(elements[1].decode('gbk')))
#生成新的数据
lines=[]
lines.append('姓名\t 电话\t 邮箱\n')
for i in range(len(list1_name)):
s=''
if list1_name[i] in list2_name:
j=list2_name.index(list1_name[i])
s='\t'.join([list1_name[i],list1_tele[i],list2_email[j]])
s+='\n'
else:
s='\t'.join([list1_name[i],list1_tele[i],str(' ----- ')])
s+='\n'
lines.append(s)
for i in range(len(list2_name)):
s=''
if list2_name[i] not in list1_name:
s='\t'.join([list2_name[i],str(' ----- '),list2_email[i]])
s+='\n'
lines.append(s)
#合并到新文件中
ftele3=open('Book.txt','w')
ftele3.writelines(lines)
ftele3.close()
ftele1.close()
ftele2.close()
print('The addressBooks are merged!')
if __name__=='__main__':
main()