Python文本读取笔记

Python中文本读取的方法

1、最好使用with来打开文件,如下

with open(file_name,'r') as f

2、读取文件内容的方法有三种: read(), readline(), readlines(), 每种方法可接受一个变量来限制每次读取的数据量, 但它们通常不使用变量。

read(), 每次读取整个文件,通常用于将文件内容放到一个字条串变量中, 但对于连续的面向行的处理,它却是不必要的,并且如果文件大于可用内存,则不可能实现这种处理。

readline() 和 readlines() 之间的差异是后者一次读取整个文件,像read() 一样。readlines() 自动将文件内容分析成一个行的列表,该列表可以由 Python 的 for ... in ... 结构进行处理。另一方面,readline() 每次只读取一行,通常比 readlines() 慢得多。仅当没有足够内存可以一次读取整个文件时,才应该使用 readline()。


3、接下来就是读取到字符串。 假设读取到的对象为line, 先用line.strip()和line.split()两个函数来给对象line瘦身和分割,就能得到我们想要的字符串列表了。

list_str = []
for line in f.readlines()
    line_str = line.strip().split()
    list_str = list_str.append(line_str)

4、如果想返回一个numpy类型数组,只需要加一句

return numpy.array(list_str)

^^^这里的strip()函数是用来去掉空格回车的,参数称为删除序列。 在有参数rm的情况下,line.strip(rm)表示删除掉line从前、后开始数,位于删除序列rm中的字符;在参数为空的情况下,默认删除空白字符(包括‘ ’,‘\t', '\n', '\r')。这里要特别注意删除的顺序,是从头尾两端开始删除,一旦遇到不在删除序列中的字符,就会停止向中间检索。

^^^这里的split()函数是用来分割的,在有参数的情况下,line.split(str)表示以字符str为界限分割line, 如果有两个参数,line.split(str,N)表示以字符str为界限分割line N次;在参数为空的情况下,默认删除空白字符,如上。


总结:这是常用的数据处理中的文本读取方法,希望能熟练掌握!


  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值