文件读取
文件对象的读取方法:
比如:
文件路径:filepath = ‘D:/111.txt’
文件内容:
ajshaks
xnshdjs
sjakksx
1.直接打开读取
filepath = 'D:/111.txt'
#打开文件
with open(filepath,'r') as f:
# 另一种写法:
#f = open(filepath, 'r')
for line in f:
print(line)
#读完以后,关闭
f.close()
结果:
ajshaks
xnshdjs
sjakksx
这个函数把文件全部内容一次性读到一个字符串中,如果用循环读取的方式输出,会是一个一个字符,因为text是字符串,本质上是tuple。
那open后面的r是什么意思呢?
r就是read缩写,代表open() 函数以只读模式打开文本文件。
那还有别的模式吗?
有,常见的如下:
- ‘r’ 打开一个只读文件
- ‘w’ 打开一个文件进行写入。如果文件存在,会覆盖它,否则会创建一个新文件
- ‘a’ 打开一个仅用于追加的文件。如果该文件不存在,会创建该文件
- ‘x’ 创建一个新文件。如果文件存在,则失败
- ‘+’ 打开一个文件进行更新
- ‘ t ’ 默认模式或二进制模式“b”打开文件
- ‘rb’ 模式以二进制模式打开文件并进行读取
- ‘wb’ 模式以文本模式打开文件以并行写入
2.read() 函数
with open(filepath,'r') as f:
text=f.read()
print(text)
print(type(text))
结果:
ajshaks
xnshdjs
sjakksx
<class 'str'>
这时候不隔行了。
3.splitlines()函数
如果需要输出字符串列表,再接着使用splitlines()方法
with open(filepath,'r') as f:
text = f.read().splitlines()# 用列表输出
print(text)
print(type(text))
结果:
['ajshaks', 'xnshdjs', 'sjakksx']
<class 'list'>
输出为list列表格式。
4.readline函数
with open(filepath,'r') as f:
text = f.readline()
print(text)
print(type(text))
输出:
ajshaks
<class 'str'>
只输出了第一个,所以想要都输出,就用下面的readlines()
5.readlines()函数
使用readlines()方法同样也可以获取文件内容的字符串列表,但后面多了/n
with open(filepath,'r') as f:
text = f.readlines()
print(text)
print(type(text))
结果:
['ajshaks\n', 'xnshdjs\n', 'sjakksx']
<class 'list'>
6.去除文本中的"\n"
我们可以使用strip()方法和for in列表迭代式去除,strip()方法去除字符串开头和结尾处的指定字符。
with open(filepath,'r') as f:
text = f.readlines()
text = [line.strip("\n") for line in text]
print(text)
print(type(text))
结果:
['ajshaks', 'xnshdjs', 'sjakksx']
<class 'list'>
这样麻烦,还不如直接用splitlines()。但都列出来让大家了解学习一下。
字符换切片
有的文本读取完,还需要切片,并转换为列表。
split()函数
拆分字符串。通过制定分隔符将字符串进行切片,并返回分割后的字符串列表[list]
str.split(str="",num=string.count(str))[n]
参数:
-
str:分隔符,默认为空格,但不能为空(“”)
-
num: 表示分割次数。如果指定num,则分割成n+1个子字符串,并可将每个字符串赋给新的变量
-
n: 选取第n个分片,即第n个字符串,从0开始算。
例子:
u = "www.google.com"
print u.split('.') --> ['www','google','com']
print u.split('.',1)-->['www','google.com']
print u.split('.',2)[1]-->google
遇见空格、逗号,点,啥的就隔开,自己定义,不写默认就是空格。
所以文件夹命名最好别有空格,我就弄了个空格,结果后面有问题。