存储文件的重要
一个程序在运行过程中用了九牛二虎之力终于计算出了结果,试想一下如果不把这些数据存放起来,相比重启电脑之后,。 默认数据是加载到内存中,结果也是保存到内存中, 程序执行结束,所有的数据释放。
要读取二进制文件,比如图片、视频等等,用’rb’, ‘wb’, 'ab’等模式打开文件即可!
mode:
r:只能读文件
w:只能写入(清空文件内容)
a+:读写(追加)
打开文件:
f = open(‘doc/hello.txt’,mode=‘a’)
文件的读写操作
f.write(’\nhello python’)
文件的关闭
f.close()
f = open('C:/Users/Shinelon/PycharmProjects/pythonProject1/python/westos',mode='a+')
f.write('\nxinxiedeo')
结果如下:
本来文件westos里面内容如下:
执行命令之后:就添加进去了
指针的概念
对于指针:seek(offset, from)有2个参数: offset:偏移量 from:方向!!
0:表示文件开头;
1:表示当前位置;
2:表示文件末尾
文件的关闭
方法一: 调用close()方法关闭文件。文件使用完毕后必须关闭,因为文件对象会占用操作系统的资源,
并且操作系统同一时间能打开的文件数量也是有限的:
方法二: Python引入了with语句来自动帮我们调用close()方法
with open('/root/PycharmProjects/pythonProject1/4/test.txt','w+') as f:
f.write('hello world\n')
f.seek(0,0) #移动指针位置到文件最开始
print("当前指针位置为:",f.tell())
print(f.read()) #读取文件内容
执行和结果如下:
若是修改指针位置:
with open('/root/PycharmProjects/pythonProject1/4/test.txt','w+') as f:
f.write('hello world\n')
f.seek(0,2) #移动指针位置到文件末尾
print("当前指针位置为:",f.tell())
print(f.read()) #读取文件内容
那么输出如下:
OS模块
功能:
os,语义为操作系统,处理操作系统相关的功能,可跨平台。 比如显示当前目录下所有文件/删除某个文件/获取文件大小……
获取操作系统的类型
import os #Linux操作系统
import platform #windows操作系统
print(os.name)
# 2.获取主机信息,windows系统使用platform模块,如果是linux系统直接使用os模块
结果如下:
我们需要完善代码:
不确定是windows系统,还是linux操作系统!!
用到
try:可能报错的执行内容!
excpt:可能异常的执行内容!
finally:都会执行的内容!
import os
import platform
try:
uname = os.uname()
except :
uname = platform.uname()
finally:
print(uname)
结果如下:
获得系统的环境变量!
import os
envs = os.environ
print(envs)
结果如下:
文件的路径问题也很重要:
先判断是不是就对的路径
import os
print(os.path.isabs('/root/PycharmProjects/pythonProject1/4/test.txt'))
print(os.path.isabs('test.txt'))
结果如下:
生成绝对路径:
import os
print(os.path.abspath('/root/PycharmProjects/pythonProject1/4/test.txt'))
print(os.path.abspath('test.txt'))
结果如下:
目录名和文件名的拼接
#os.path.dirname获取某个文件对应的目录名
#__file__是指当前文件
#join 拼接,将目录和文件名拼接起来
import os
BASE_DIR = os.path.dirname(__file__)
setting_file = os.path.join(BASE_DIR,'dev.conf')
print(setting_file)
结果如下:
获取目录名或者文件名
import os
filename = 'D:/root/westos/test.txt'
print(os.path.basename(filename)) #输出文件名
print(os.path.dirname(filename)) #输出文件所在目录
结果如下:
介绍文件的创建和删除
os模块中的rename()可以完成对文件的重命名操作。
rename(需要修改的文件名, 新的文件名)
os模块中的remove()可以完成对文件的删除操作
remove(待删除的文件名)
import os
os.makedirs('/home/kiosk/PycharmProjects/pythonProject/6/westos/ss') #递归创建目录
os.mkdir('/home/kiosk/PycharmProjects/pythonProject/6/sun') #创建单个目录
结果如下:
创建目录成功!!
接着删除目录和文件!
执行remdir删除目录
删除递归目录!
创建文件和删除文件!
创建文件!
删除文件!
修改文件名
os.rename('/home/kiosk/PycharmProjects/pythonProject/6/ok.txt','/home/kiosk/PycharmProjects/pythonProject/6/westos.txt')
结果如下:
判断文件或者目录是否存在
分离后缀名和文件名
将目录名和文件名分离
import os
print(os.path.exists('.txt'))
print(os.path.splitext('t'))
print(os.path.split('westos.txt'))
print(os.path.split('/home/kiosk/PycharmProjects/pythonProject/6/westos.txt'))
结果如下:
json模块详细解释
JSON(JavaScript Object Notation) 是一种轻量级的数据交换格式。它基于ECMAScript的一个子集。
JSON采用完全独立于语言的文本格式,但是也使用了类似于C语言家族的习惯(包括C、C++、Java、JavaScript、Perl、Python等)。
这些特性使JSON成为理想的数据交换语言。易于人阅读和编写,同时也易于机器解析和生成(一般用于提升网络传输速率)。
那么python和JSON数据转化的规则:
pyhton中的集合不能转成json格式。
1,先来介绍python编码为json字符串
import json
users = {'name':'westos','age':20,'obj':'linux'}
json_str = json.dumps(users)
print(users,type(users))
print(json_str,type(json_str))
结果如下:
再把python转为的json字符串输出到文件中!
import json
users = {'name':'westos','age':20,'obj':'linux'}
json_str = json.dumps(users)
with open('/home/kiosk/PycharmProjects/pythonProject/7/t.json','w') as f:
json.dump(users,f,ensure_ascii=False,indent=4)
print('shuchu success!!')
print(users,type(users))
print(json_str,type(json_str))
结果如下:
生成的文件内容为::
2,json字符串解码成python对象
import json
with open('/home/kiosk/PycharmProjects/pythonProject/7/t.json') as f:
python_obj = json.load(f)
print(python_obj,type(python_obj))
输出结果为:
pandas模块
首先需要打开terminal安装模块!
选择豆瓣源的路径下载快!
pip install pandas -i https://pypi.douban.com/simple
结果如下:
接着安装excel文件操作需要的模块!
pip install openpyxl -i https://pypi.douban.com/simple
安装如下:
转换代码操作
import pandas
hosts = [
{'host':'1.1.1.1', 'hostname':'server1', 'idc':'baidu'},
{'host':'1.1.1.2', 'hostname':'server2', 'idc':'huawei'},
{'host':'1.1.1.3', 'hostname':'server3', 'idc':'tengxun'},
{'host':'1.1.1.4', 'hostname':'server4', 'idc':'wangyi'},
]
df = pandas.DataFrame(hosts)
print(df)
df.to_excel('/home/kiosk/PycharmProjects/pythonProject/7/test.xlsx')
结果如下:
生成的excl如下:
练习
统计词频
题目要求:
技能需求:
- 文件操作
- 字符串的分割操作
- 字典操作
功能需求:词频统计- 读取song.txt文件 withopen(filename) as f: content=f.read()
2.分析文件中的每一个单词,统计每个单词出现的次数。{“hello”:2, “python”:1, “java”:1} -分析文件中的每一个单词
content = “hello python hello java”
words =content.split()
-统计每个单词出现的次数- {“hello”:2, “python”:1, “java”:1} #
words = [‘hello’, ‘python’, ‘hello’, ‘java’]
import pandas
with open('/home/kiosk/PycharmProjects/pythonProject/7/song.txt') as f: content=f.read()
words = content.split()
result = {}
for i in words:
if i not in result: result[i] =1
else: result[i] +=1
import pprint
pprint.pprint(result)
文件内容如下:
输出的结果为: