Task01 文件自动化处理&邮件批量处理
1.读写文件
1.1 文件与文件路径
```python
import os
os.path.join('Datawhale','docu')#读写文件
'Datawhale\\docu'
`
1.2 当前工作目录
每个运行在计算机上的程序,都有一个“当前工作目录”。利用os.getcwd()
函数,可以取得当前工作路径的
字符串,并可以利用os.chdir()
改变它。
```python
import os
os.getcwd() #获取当前工作目录
‘C:\Users\晴天\晴天’
os.chdir('D:\Datawhale') #改变当前工作目录
os.getcwd()
‘D:\Datawhale’
在这里插入代码片
目录地址有3种写法:
- 双反斜杠:os.chdir(‘D:\Datawhale\python’)
- 斜杠:os.chdir(‘D:/Datawhale/python’)
- 前面加一个r:os.chdir(r’D:\Datawhale\python’)
1.3 路径操作
“绝对路径”,总是从根文件夹开始。
“相对路径”,相对于程序的当前工作目录。
相对路径中,单个句点“.”表示当前目录的缩写,两个句点“…”表示父文件夹
os.path.abspath('D:\Datawhale') #当前路径转化为绝对路径
os.path.isabs('D:\Datawhale') #False
os.path.isabs(os.path.abspath('D:\Datawhale')) #ture
True
os.path.relpath('D:\Datawhale','D:\\')
os.path.dirname('D:\Datawhale')#返回当前路径的目录名称
os.path.basename('D:\Datawhale')
caFilePath = 'D:\Datawhale\其他文件'#调用一个路径的目录和基本名称
os.path.split(caFilePath)
(‘D:\Datawhale’, ‘其他文件’)
caFilePath = 'D:\Datawhale\其他文件'
(os.path.dirname(caFilePath),os.path.basename(caFilePath))
#调用一个路径的目录和基本名称
caFilePath.split(os.path.sep) #返回每个文件夹的字符串的列表,用sep进行分割
['D:', 'Datawhale', '其他文件']
os.path.exists('D:\Datawhale\其他文件')#检查路径是否有效,存在即ture
os.path.isfile('D:\Datawhale\python办公自动化\hello.txt')
#检查路径中文件是否有效
os.path.isdir('D:\Datawhale\其他文件')#文件夹是否存在
True
1.4 文件及文件夹操作
用os.makedirs()创建新文件夹用os.makedirs()创建新文件夹
注:os.makedirs()
可以创建所有必要的中间文件夹。
1.4.1用os.makedirs()创建新文件夹
import os
os.makedirs('D:\\Datawhale\\lian') #创建文件夹,已创建,若文件夹已存在,不会覆盖,会报错
`
1.4.2查看文件大小和文件夹内容
Name | Tags |
---|---|
os.path.getsize(path) | 返回path参数中文件的字节数 |
os.listdir(path)手机 | 返回文件名字符串的列表,包含path参数中的每个文件 |
os.path.getsize('D:\\Datawhale\\lianxi')#查看文件的大小
os.listdir('D:\\Datawhale\\python办公自动化')#返回文件,并查看文件内容
totalSize = 0
#如果想知道目录下所有文件的总字节数,可以同时使用 os.path.getsize() 和 os.listdir()
for filename in os.listdir('D:\\Datawhale\\python办公自动化'):
totalSize = totalSize + os.path.getsize(os.path.join('D:\\Datawhale\\python办公自动化',filename))
print(totalSize)#目录下所有文件的字节数
1.5 文件读写过程
读写文件3个步骤:
1.调用open()
函数,返回一个File对象。
2.调用File对象的read()
或write()
方法。
3.调用File对象的close()
方法,关闭该文件。
1.5.1用open()函数打开文件
helloFile = open('D:\\Datawhale\\python办公自动化\\hello.txt')
print(helloFile.read())#直接书写print(helloFile)会报错,
#因为文件的编码导致故书文件名。写格式,print(文件名。read())
helloContent = helloFile.read()
helloContent
Hello World!
1.5.2 读取文件内容
Name | Tags |
---|---|
read() | 读取文件内容 |
readlines() | 按行读取文件中内容,取得一个字符串列表,列表中每个字符串是文本中的一行且以\n结束 |
```python
sonnetFile = open('D:\\Datawhale\\python办公自动化\\hello.txt')
sonnetFile.readlines()
[‘Hello World!’]
1.5.3 写入文件
需要用“写模式”‘w’和“添加模式”'a’打开一个文件,而不能用读模式打开文件。
“写模式”将覆写原有的文件,从头开始。“添加模式”将在已有文件的末尾添加文本。
#1.1.6.3写入文件
baconFile = open('菜单.txt','w')#创建新的记事本,w添加问价
baconFile.write('端午菜单\n')#往文件里写入内容
baconFile.close() #关闭后查看写入的内容
baconFile = open('bacon.txt','a')
baconFile.write('Bacon is not a vegetable.')
baconFile.close()
baconFile = open('菜单.txt','a')#A是在原有的基础上添加内容。w是覆盖原有的内容
baconFile.write('端午吃鸡\n')#往文件里写入内容
baconFile.close()
baconFile = open('菜单.txt')#打开文件并赋值变量名并输出
content = baconFile.read()
baconFile.close()
print(content)
端午菜单
端午吃鸡
1.5.4保存变量——shelve模块
用shelve
模块,可以将Python中的变量保存到二进制的shelf
文件中。这样,程序就可以从硬盘中恢复变量的数据。
# shelve是一个简单的数据存储方案,类似key-value数据库,
#可以很方便的保存python对象,其内部是通过pickle协议来实现数据序列化。
#shelve只有一个open()函数,这个函数用于打开指定的文件(一个持久的字典),
#然后返回一个shelf对象。shelf是一种持久的、类似字典的对象。
os.chdir('D:\Datawhale') #改变当前工作目录
os.getcwd()
import shelve # 引入 shelve包
shelfFile = shelve.open('mydata')
cats = ['Zonphie','Pooka','Simon']
shelfFile['cats'] = cats
shelfFile.close()
shelfFile = shelve.open('mydata')
type(shelfFile)
shelfFile['cats']
shelfFile.close()#返回类似的值表,却不是真正的表,需要重新传递给到list
shelfFile = shelve.open('mydata')
list(shelfFile.keys())
list(shelfFile.values())
shelfFile.close()
1.5.4 保存变量——pprint.pformat()函数
pprint.pformat()
函数返回要打印的内容的文本字符串,这个字符串既易于阅读,也是语法上正确的Python代码。
os.chdir('D:\Datawhale') #改变当前工作目录
os.getcwd()
# pprint.pformat() 函数保存变量
import pprint
cats = [{'name':'Zophie','desc':'chubby'},{'name':'Pooka','desc':'fluffy'}]
#定义变量名casts为某个值
pprint.pformat(cats)
fileObj = open('myCats.py','w')
fileObj.write('cats = '+pprint.pformat(cats)+'\n')
fileObj.close()
import myCats
myCats.cats
myCats.cats[0]
myCats.cats[0]['name']
1.6 练习
1、如果已有的文件以写模式打开,会发生什么?
2、read()
和readlines()
方法之间的区别是什么?
read()打开的是读取的内容
read([size])方法从文件当前位置起读取size个字节,若无参数size,则表示读取至文件结束为止,它范围为字符串对象。readlines()方法读取整个文件所有行,保存在一个列表(list)变量中,每行作为一个元素,但读取大文件会比较占内存:
1.7 综合练习
不是很熟练,只找到了一个如何批量整出35个文件夹的代码
参见大佬作品:
import random
capitals = {'Alabama': 'Montgomery', 'Alaska': 'Juneau', 'Arizona': 'Phoenix',
'Arkansas': 'Little Rock', 'California': 'Sacramento', 'Colorado':
'Denver','Connecticut': 'Hartford', 'Delaware': 'Dover', 'Florida':
'Tallahassee','Georgia': 'Atlanta', 'Hawaii': 'Honolulu', 'Idaho':
'Boise', 'Illinois': 'Springfield', 'Indiana': 'Indianapolis', 'Iowa':
'Des Moines', 'Kansas': 'Topeka', 'Kentucky': 'Frankfort', 'Louisiana':
'Baton Rouge', 'Maine': 'Augusta', 'Maryland': 'Annapolis', 'Massachusetts':
'Boston', 'Michigan': 'Lansing', 'Minnesota': 'Saint Paul', 'Mississippi':
'Jackson', 'Missouri': 'Jefferson City', 'Montana': 'Helena', 'Nebraska':
'Lincoln', 'Nevada': 'Carson City', 'New Hampshire': 'Concord',
'New Jersey': 'Trenton', 'New Mexico':'Santa Fe', 'New York': 'Albany', 'North Carolina': 'Raleigh',
'North Dakota': 'Bismarck', 'Ohio': 'Columbus', 'Oklahoma': 'Oklahoma City',
'Oregon': 'Salem', 'Pennsylvania': 'Harrisburg', 'Rhode Island': 'Providence',
'South Carolina': 'Columbia', 'South Dakota': 'Pierre', 'Tennessee':
'Nashville', 'Texas': 'Austin', 'Utah': 'Salt Lake City', 'Vermont':
'Montpelier', 'Virginia': 'Richmond', 'Washington': 'Olympia', 'West Virginia':
'Charleston', 'Wisconsin': 'Madison', 'Wyoming': 'Cheyenne'}
for quizNum in range(35):
# 创建试卷和答案文件
quizFile = open('capticalsquiz%s.txt' % (quizNum + 1), 'w')
answerKeyFile = open('capticalsquiz_answers%s.txt' % (quizNum + 1), 'w')
# 写标题和开头
quizFile.write('Name:\n\nDate:\n\nClass:\n\n')
quizFile.write(' ' * 20 + 'State Capticals Quiz (From %s)' % (quizNum + 1))
quizFile.write('\n\n')
# 打乱capital字典
states = list(capitals.keys())
random.shuffle(states) # 打乱states的顺序
# 循环states,制造50个问题
for questionNum in range(50):
correctAnswer = capitals[states[questionNum]]
wrongAnswers = list(capitals.values())
del wrongAnswers[wrongAnswers.index(correctAnswer)] # 删除列表中的正确答案
# random.sample()函数使得这种选择很容易,它的第一个参数是你希望选择的列表,第二个参数是你希望选择的值的个数。
wrongAnswers = random.sample(wrongAnswers, 3)
answerOption = wrongAnswers + [correctAnswer]
random.shuffle(answerOption)
# 在文件中写入问题
quizFile.write('%s. What is the capital of %s?\n' % (questionNum + 1,
states[questionNum]))
for i in range(4):
quizFile.write(' %s. %s\n' % ('ABCD'[i], answerOption[i]))
quizFile.write('\n')
# 在答案卷中写入答案
answerKeyFile.write('%s. %s\n' % (questionNum + 1, 'ABCD'[
answerOption.index(correctAnswer)]))
quizFile.close()
answerKeyFile.close()