2021-06-16

最新推荐文章于 2021-11-09 20:10:55 发布

晴天记忆

最新推荐文章于 2021-11-09 20:10:55 发布

阅读量145

点赞数

文章标签：无监督学习 python

本文链接：https://blog.csdn.net/m0_58672463/article/details/117968441

版权

Task01 文件自动化处理&邮件批量处理

1.读写文件

1.读写文件

1.1 文件与文件路径

```python
import os
os.path.join('Datawhale','docu')#读写文件

'Datawhale\\docu'

1.2 当前工作目录

每个运行在计算机上的程序，都有一个“当前工作目录”。利用os.getcwd()函数，可以取得当前工作路径的
字符串，并可以利用os.chdir()改变它。

```python
import os
os.getcwd()  #获取当前工作目录

‘C:\Users\晴天\晴天’

os.chdir('D:\Datawhale')          #改变当前工作目录
os.getcwd()

‘D:\Datawhale’
在这里插入代码片

目录地址有3种写法：

双反斜杠：os.chdir(‘D:\Datawhale\python’)
斜杠：os.chdir(‘D:/Datawhale/python’)
前面加一个r：os.chdir(r’D:\Datawhale\python’)

1.3 路径操作

“绝对路径”，总是从根文件夹开始。
“相对路径”，相对于程序的当前工作目录。
相对路径中，单个句点“.”表示当前目录的缩写，两个句点“…”表示父文件夹
在这里插入图片描述

os.path.abspath('D:\Datawhale') #当前路径转化为绝对路径
os.path.isabs('D:\Datawhale')     #False
os.path.isabs(os.path.abspath('D:\Datawhale')) #ture

True

os.path.relpath('D:\Datawhale','D:\\')    
os.path.dirname('D:\Datawhale')#返回当前路径的目录名称
os.path.basename('D:\Datawhale') 
caFilePath = 'D:\Datawhale\其他文件'#调用一个路径的目录和基本名称
os.path.split(caFilePath)

(‘D:\Datawhale’, ‘其他文件’)

caFilePath = 'D:\Datawhale\其他文件'
(os.path.dirname(caFilePath),os.path.basename(caFilePath)) 
#调用一个路径的目录和基本名称
caFilePath.split(os.path.sep) #返回每个文件夹的字符串的列表,用sep进行分割

['D:', 'Datawhale', '其他文件']

os.path.exists('D:\Datawhale\其他文件')#检查路径是否有效，存在即ture
os.path.isfile('D:\Datawhale\python办公自动化\hello.txt')
#检查路径中文件是否有效
os.path.isdir('D:\Datawhale\其他文件')#文件夹是否存在

True

1.4 文件及文件夹操作

用os.makedirs()创建新文件夹用os.makedirs()创建新文件夹
注：os.makedirs()可以创建所有必要的中间文件夹。
1.4.1用os.makedirs()创建新文件夹

import os
os.makedirs('D:\\Datawhale\\lian') #创建文件夹，已创建，若文件夹已存在，不会覆盖，会报错

` 在这里插入图片描述

1.4.2查看文件大小和文件夹内容

Name	Tags
os.path.getsize(path)	返回path参数中文件的字节数
os.listdir(path)手机	返回文件名字符串的列表，包含path参数中的每个文件

os.path.getsize('D:\\Datawhale\\lianxi')#查看文件的大小
os.listdir('D:\\Datawhale\\python办公自动化')#返回文件，并查看文件内容
totalSize = 0
#如果想知道目录下所有文件的总字节数，可以同时使用 os.path.getsize() 和 os.listdir()

for filename in os.listdir('D:\\Datawhale\\python办公自动化'):
    totalSize = totalSize + os.path.getsize(os.path.join('D:\\Datawhale\\python办公自动化',filename))
print(totalSize)#目录下所有文件的字节数

1.5 文件读写过程

读写文件3个步骤：
1.调用open()函数，返回一个File对象。
2.调用File对象的read()或write()方法。
3.调用File对象的close()方法，关闭该文件。

1.5.1用open()函数打开文件

helloFile = open('D:\\Datawhale\\python办公自动化\\hello.txt')
print(helloFile.read())#直接书写print（helloFile）会报错，
#因为文件的编码导致故书文件名。写格式,print(文件名。read())
helloContent = helloFile.read()
helloContent

Hello World!

1.5.2 读取文件内容

Name	Tags
read()	读取文件内容
readlines()	按行读取文件中内容，取得一个字符串列表，列表中每个字符串是文本中的一行且以\n结束

```python
sonnetFile = open('D:\\Datawhale\\python办公自动化\\hello.txt')
sonnetFile.readlines()

[‘Hello World!’]
1.5.3 写入文件
需要用“写模式”‘w’和“添加模式”'a’打开一个文件，而不能用读模式打开文件。
“写模式”将覆写原有的文件，从头开始。“添加模式”将在已有文件的末尾添加文本。

#1.1.6.3写入文件
baconFile = open('菜单.txt','w')#创建新的记事本，w添加问价
baconFile.write('端午菜单\n')#往文件里写入内容
baconFile.close() #关闭后查看写入的内容
baconFile = open('bacon.txt','a')
baconFile.write('Bacon is not a vegetable.')
baconFile.close() 
baconFile = open('菜单.txt','a')#A是在原有的基础上添加内容。w是覆盖原有的内容
baconFile.write('端午吃鸡\n')#往文件里写入内容
baconFile.close() 
baconFile = open('菜单.txt')#打开文件并赋值变量名并输出
content = baconFile.read()
baconFile.close()
print(content)

端午菜单
端午吃鸡

1.5.4保存变量——shelve模块
用shelve模块，可以将Python中的变量保存到二进制的shelf文件中。这样，程序就可以从硬盘中恢复变量的数据。

#  shelve是一个简单的数据存储方案，类似key-value数据库，
#可以很方便的保存python对象，其内部是通过pickle协议来实现数据序列化。
#shelve只有一个open()函数，这个函数用于打开指定的文件（一个持久的字典），
#然后返回一个shelf对象。shelf是一种持久的、类似字典的对象。
os.chdir('D:\Datawhale')          #改变当前工作目录
os.getcwd() 
import shelve # 引入 shelve包
shelfFile = shelve.open('mydata')
cats = ['Zonphie','Pooka','Simon']
shelfFile['cats'] = cats
shelfFile.close()

shelfFile = shelve.open('mydata')
type(shelfFile)
shelfFile['cats']
shelfFile.close()#返回类似的值表，却不是真正的表，需要重新传递给到list
shelfFile = shelve.open('mydata')
list(shelfFile.keys())
list(shelfFile.values())
shelfFile.close()

1.5.4 保存变量——pprint.pformat()函数
pprint.pformat()函数返回要打印的内容的文本字符串，这个字符串既易于阅读，也是语法上正确的Python代码。

os.chdir('D:\Datawhale')          #改变当前工作目录
os.getcwd() 
# pprint.pformat() 函数保存变量
import pprint
cats = [{'name':'Zophie','desc':'chubby'},{'name':'Pooka','desc':'fluffy'}]
#定义变量名casts为某个值
pprint.pformat(cats)
fileObj = open('myCats.py','w')
fileObj.write('cats = '+pprint.pformat(cats)+'\n')
fileObj.close()
import myCats
myCats.cats
myCats.cats[0]
myCats.cats[0]['name']

1.6 练习

1、如果已有的文件以写模式打开，会发生什么？

2、read()和readlines()方法之间的区别是什么？
read()打开的是读取的内容
read([size])方法从文件当前位置起读取size个字节，若无参数size，则表示读取至文件结束为止，它范围为字符串对象。readlines()方法读取整个文件所有行，保存在一个列表(list)变量中，每行作为一个元素，但读取大文件会比较占内存:

1.7 综合练习

不是很熟练，只找到了一个如何批量整出35个文件夹的代码

参见大佬作品：

import random

capitals = {'Alabama': 'Montgomery', 'Alaska': 'Juneau', 'Arizona': 'Phoenix',
            'Arkansas': 'Little Rock', 'California': 'Sacramento', 'Colorado':
            'Denver','Connecticut': 'Hartford', 'Delaware': 'Dover', 'Florida':
            'Tallahassee','Georgia': 'Atlanta', 'Hawaii': 'Honolulu', 'Idaho':
            'Boise', 'Illinois': 'Springfield', 'Indiana': 'Indianapolis', 'Iowa':
            'Des Moines', 'Kansas': 'Topeka', 'Kentucky': 'Frankfort', 'Louisiana':
            'Baton Rouge', 'Maine': 'Augusta', 'Maryland': 'Annapolis', 'Massachusetts':
            'Boston', 'Michigan': 'Lansing', 'Minnesota': 'Saint Paul', 'Mississippi':
            'Jackson', 'Missouri': 'Jefferson City', 'Montana': 'Helena', 'Nebraska':
            'Lincoln', 'Nevada': 'Carson City', 'New Hampshire': 'Concord',
            'New Jersey': 'Trenton', 'New Mexico':'Santa Fe', 'New York': 'Albany', 'North Carolina': 'Raleigh',
            'North Dakota': 'Bismarck', 'Ohio': 'Columbus', 'Oklahoma': 'Oklahoma City',
            'Oregon': 'Salem', 'Pennsylvania': 'Harrisburg', 'Rhode Island': 'Providence',
            'South Carolina': 'Columbia', 'South Dakota': 'Pierre', 'Tennessee':
            'Nashville', 'Texas': 'Austin', 'Utah': 'Salt Lake City', 'Vermont':
            'Montpelier', 'Virginia': 'Richmond', 'Washington': 'Olympia', 'West Virginia':
            'Charleston', 'Wisconsin': 'Madison', 'Wyoming': 'Cheyenne'}


for quizNum in range(35):
    # 创建试卷和答案文件
    quizFile = open('capticalsquiz%s.txt' % (quizNum + 1), 'w')
    answerKeyFile = open('capticalsquiz_answers%s.txt' % (quizNum + 1), 'w')

    # 写标题和开头
    quizFile.write('Name:\n\nDate:\n\nClass:\n\n')
    quizFile.write(' ' * 20 + 'State Capticals Quiz (From %s)' % (quizNum + 1))
    quizFile.write('\n\n')

    # 打乱capital字典
    states = list(capitals.keys())
    random.shuffle(states)  # 打乱states的顺序

    # 循环states，制造50个问题
    for questionNum in range(50):
        correctAnswer = capitals[states[questionNum]]
        wrongAnswers = list(capitals.values())
        del wrongAnswers[wrongAnswers.index(correctAnswer)]  # 删除列表中的正确答案
        # random.sample()函数使得这种选择很容易，它的第一个参数是你希望选择的列表，第二个参数是你希望选择的值的个数。
        wrongAnswers = random.sample(wrongAnswers, 3)
        answerOption = wrongAnswers + [correctAnswer]
        random.shuffle(answerOption)
        # 在文件中写入问题
        quizFile.write('%s. What is the capital of %s?\n' % (questionNum + 1,
                        states[questionNum]))
        for i in range(4):
            quizFile.write(' %s. %s\n' % ('ABCD'[i], answerOption[i]))
        quizFile.write('\n')

        # 在答案卷中写入答案
        answerKeyFile.write('%s. %s\n' % (questionNum + 1, 'ABCD'[
            answerOption.index(correctAnswer)]))

    quizFile.close()
    answerKeyFile.close()

晴天记忆

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
2021-06-16

Task01 文件自动化处理&邮件批量处理1.读写文件1.1 文件与文件路径1.2 当前工作目录1.3 路径操作1.4 文件及文件夹操作1.5 文件读写过程1.6 练习1.7 综合练习1.读写文件1.1 文件与文件路径```pythonimport osos.path.join('Datawhale','docu')#读写文件'Datawhale\\docu'`1.2 当前工作目录每个运行在计算机上的程序，都有一个“当前工作目录”。利用os.getcwd(
复制链接

扫一扫