第七周:文件和数据格式化(Python学习笔记)

文件和数据格式化

数据格式化:将一组数据按照一定规格和式样进行规范:表示、存储、运算等

  • 文件的使用
  • 一维数据的格式化和处理
  • 二维数据的格式化和处理

文件的使用

文件的类型
文件是数据的抽象和集合
文件是存储在辅助存储器上的数据序列
文件时数据存储的一种形式
文件展现形态:文本文件和二进制文件
文本文件vs.二进制文件
文本文件和二进制文件值是文件的展示方式
本质上,所有文件都是二进制形式存储
形式上,所有文件采用两种方式展示
文本文件
由单一特定编码组成的文件,如UTF-8编码
由于存在编码,也被看成是存储着的长字符串
适用于例如:.txt文件、.py文件
二进制文件
直接由比特0和1组成,没有同意字符编码
一般存在二进制0和1的组织结构,即文件格式
适用于例如:.png文件、.avi文件等
这里写图片描述

f.txt文件保存:“中国是个伟大的国家!”

#文本形式打开文件
tf = open("f.txt"."rt")
print(tf.readline())
tf.close()

将上述代码和f.txt文件保存在同一个目录,运行后将会得到
这里写图片描述

#二进制形式打开文件
bf = open("f.txt","rb")
print(bf.readline())
bf.close()

将上述代码和f.txt文件保存在同一个目录,运行后将会得到
这里写图片描述

文件的打开和关闭

文件处理的步骤:打开-操作-关闭
这里写图片描述

文件的打开
这里写图片描述
这里写图片描述

文件的打开模式
七种:’r’ , ‘w’ , ‘x’ , ‘a’ , ‘b’ , ‘t’ , ‘+’
这里写图片描述
这里写图片描述
文件的关闭
这里写图片描述

文件内容的读取

方法:a.read(size=-1)、a.readline(size=-1)、a.readlines(hint=-1)
这里写图片描述
这里写图片描述

遍历全文本:方法一 这里写图片描述 遍历全文本:方法二 这里写图片描述 文件的逐行操作
逐行遍历文件:方法一
这里写图片描述
逐行遍历文件:方法二
这里写图片描述
数据的文件写入

操作方法:a.write(s) 、a.writelines(lines) 、a.seek(offset)
这里写图片描述
这里写图片描述
这里写图片描述
这里写图片描述

小结
  1. 文件的使用方式:打开-操作-关闭
  2. 文本文件&二进制文件,open(,)和close(,)
  3. 文件内容的读取:.read() .readline() .readlines()
  4. 数据的文件写入:.write() .writelines() .seek()

一维数据的格式化和处理

数据组织的维度
从一个数据到一组数据 这里写图片描述 维度:一组数据的组织形式 这里写图片描述 一维数据
由对等关系的有序或无序数据构成,采用线性方式组织

对应列表、数组和集合等概念

二维数据
由多个一维数据构成,是一维数据的组合形式
这里写图片描述
多维数据
由一维或二维数据在新维度上扩展形成
这里写图片描述
高维数据
仅利用最基本的二元关系展示数据间的复杂结构
这里写图片描述
数据的操作周期
存储<->表示<->操作
这里写图片描述
一维数据的表示
如果数据间有序:使用列表类型
列表类型可以表达一维有序数据
for循环可以遍历数据,进而对每个数据进行处理
如果数据间无序:使用集合类型
集合类型可以表达一维无序数据
for循环可以遍历数据,进而对每个数据进行处理
一维数据的存储
存储方式一:空格分隔
使用一个或多个空格进行存储,不换行
缺点:数据中不能存在空格
这里写图片描述
存储方式二:逗号分隔
使用英文半角逗号分隔数据进行存储,不换行
缺点:数据中不能由英文逗号
这里写图片描述
存储方式三:其他方式
使用其他符号或符号组合分隔,建议采用特殊符号
缺点:需要根据数据特点定义,通用性较差
这里写图片描述
一维数据的处理
存储<->表示
这里写图片描述
从空格分隔的文件中读入数据
这里写图片描述
从特殊符号分隔的文件中读入数据
这里写图片描述
采用空格分隔方式将数据写入文件
这里写图片描述
采用特殊分隔方式将数据写入文件
这里写图片描述
小结
  1. 数据的维度:一维、二维、多维、高维
  2. 一维数的表示:列表类型(有序)和集合类型(无序)
  3. 一维数据的存储:空格分隔、逗号分隔、特殊符号分隔
  4. 一维数据的处理:字符串方法 .split()和.join()

二维数据的格式化和处理

二维数据的表示
使用列表类型
列表类型可以表达二位数据
使用二维列表
使用两层for循环遍历每个元素
外层列表中每个元素可以对应一行,也可以对应一列
数据维度数数据的组织形式
一维数据:列表和集合类型
二维数据:列表类型
CAV格式与二维数据存储
csv:Comma-Separated Values(由逗号分隔的值)
国际通用的一二维数据存储格式,一般.csv扩展名
每行一个一维数据,采用逗号分隔,无空行
Excel软件可读入输出,一般编辑软件都可以产生
这里写图片描述
如果某个元素缺失,逗号仍要保留
二位数据的表头可以作为数据存储,也可以另行存储
逗号为英文半角逗号,逗号与数据之间无额外空格
按行存?按列存?
按行存或按列存都可以,具体由程序决定
一般索引习惯:ls[row][column],先行后列
根据一般习惯,外层列表每个元素是一行,按行存
二维数据的处理
从CSV格式的文件中读入数据
这里写图片描述
将数据写入CSV格式的文件
这里写图片描述
采用二层循环
这里写图片描述
小结
  1. 二维数据的表示:列表类型,其中每个元素也是一个列表
  2. CSV格式:逗号分隔表示一维,按行分隔表示二维
  3. 二维数据的处理:for循环+.split()和.join()
  • 9
    点赞
  • 41
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值