文件与数据格式化

7.1文件概述
文件标识
文件标识的意义:找到计算机中唯一确定的文件。
•文件标识的组成:文件路径、文件名主干、文件扩展名。
文件类型

根据数据的逻辑存储结构,人们将计算机中的文件分为文本文件和二进制文件。
●文本文件:专门存储文本字符数据。
●二进制文件:不能直接使用文字处理程序正常读写,必须先了解其结构和序列化规则,再设计正确的反序列化规则,才能正确获取文件信息。
二进制文件和文本文件这两种类型的划分基于数据逻辑存储结构而非物理存储结构,计算机中的数据在物理层面都以二进制形式存储。
7.2文件的基本操作
文件的打开、关闭与读写是文件的基础操作,任何更复杂的文件操作都离不开这些操作
7.2.1 文件的打开与关闭
打开文件
内置函数open()用于打开文件,该方法的声明如下:
open(file, mode=‘r’, buffering=-1)

若open()函数调用成功,返回一个文件对象。
若待打开的文件不存在,文件打开失败,程序会抛出异常,并打印错误信息。
7.2.2文件的读写
Python提供了一系列读写文件的方法,包括读取文件的read()、readline()、readlines()方法和写文件的write()、writelines()方法,下面结合这些方法分别介绍如何读写文件。
read()(参数缺省时)和readlines()方法都可一次读取文件中的全部数据
但因为计算机的内存是有限的,若文件较大,read()和readlines()的一次读取便会耗尽系统内存,所以这两种操作都不够安全。
为了保证读取安全,通常多次调用read()方法,每次读取size字节的数据。
7.2.3文件的定位读写
•在文件的一次打开与关闭之间进行的读写操作是连续的,程序总是从上次读写的位置继续向下进行读写操作。
•每个文件对象都有一个称为“文件读写位置”的属性,该属性会记录当前读写的位置。
•文件读写位置默认为0,即在文件首部
Python提供了一些获取与修改文件读写位置的方法,以实现文件的定位读写。
•tell()。获取文件当前的读写位置。
•seek()。控制文件的读写位置。
7.3文件与目录管理
os模块中定义了与文件操作相关的函数,利用这些函数可以实现删除文件、文件重命名、创建/删除目录、获取当前目录、更改默认目录与获取目录列表等操作。
管理文件与目录
删除文件——os.remove(文件名)
文件重命名——os.rename(原文件名,新文件名)
创建/删除目录——os.mkdir(目录名)/os.rmdir(目录名)
获取当前目录——os.getcwd()
更改默认目录——os.chdir(路径名)
获取目录列表——os.listdir(目录/路径)
7.5 数据维度与数据格式化
7.5.1 基于维度的数据分类
基于维度的数据分类
根据组织数据时与数据有联系的参数的数量,数据可分为一维数据、二维数据和多维数据。
具有对等关系的一组线性数据,如:
●一维列表
●一维元组
●集合

一维数据
二维数据关联参数的数量为2,如:
●矩阵
●二维数组
●二维列表
●二维元组
7.5.2 一二维数据的存储与读写
1.数据存储
CSV格式规范:
•以纯文本形式存储表格数据
•文件的每一行对应表格中的一条数据记录
•每条记录由一个或多个字段组成
•字段之间使用逗号(英文、半角)分隔
7.5.3 多维数据的格式化
多维数据的格式化
为了直观地表示多维数据,也为了便于组织和操作,三维及以上的多维数据统一采用键值对的形式进行格式化。
网络平台上传递的数据大多是高维数据,JSON是网络中常见的高维数据格式。JSON格式的数据遵循以下语法规则:

•数据存储在键值对(key:value)中,例如“姓名”: “张华”。
•数据的字段由逗号分隔,例如“姓名”: “张华”, “语文”: “116”。
•一个花括号保存一个JSON对象,例如{“姓名”: “张华”, “语文”: “116”}。
•一个方括号保存一个数组,例如[{“姓名”: “张华”, “语文”: “116”}]。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值