一.数据的组织维度
1.数据的组织
一组数据在被计算机处理前需要进行一定的组织,表明数据间的基本关系和逻辑,进而形成"数据的维度"。
2.分类
一维数据
二维数据
高维数据
二.数据处理
1.CSV格式
其中由逗号分隔的存储格式叫做CSV格式,这是一种通用的相对简单的文件格式,在商业和科学上应用广泛,大部分编辑器支持直接读入或保存CSV格式的文件
2.一维数据
一维数据由对等关系的有序或无序数据构成,采用线性组织方式
北京,上海,重庆,深圳,天津
#这就是一维数据的线性组织方式
一维数据的表示
由于一维数据是线性组织方式,所以一般用列表来表示
["北京","上海","重庆","深圳","天津"]
#这就是一维数据的线性组织方式
一维数据的存储
一维数据存储的方式很多,总体思路是采用特殊字符分隔各个数据,常用的存储方法有以下4种
#采用逗号分隔
北京,上海,重庆,深圳,天津
#采用空格分隔
北京 上海 重庆 深圳 天津
#采用换行分隔
北京
上海
重庆
深圳
天津
#采用其他特殊符号分隔如分号
北京;上海;庆;深圳;天津
列表对象输出为CSV格式
ls=["北京","上海","重庆","深圳","天津"]
f=open("E:\\city.csv","w")
f.write(",".join(ls)+"\n")
f.close()
CSV格式文件表示为列表对象
f=open("city.csv","r")
ls=f.read().strip('\n').split(",")
f.close()
print(ls)
#打印结果为["北京","上海","重庆","深圳","天津"]
3.二维数据
二维数据也称表格,由关联关系数据构成,采用表格方式组织,对应于数学中的矩阵,常见的表格都属于二维数据,如国家统计局发布的大中城市新建住宅价格指数是二维数据
学生 身高 体重
张三 170 6 0
王五 178 8 0
#这就是关联关系数据
二维数据由多条一维数据构成,可以看成是一维数据的组合形式,因此二维数据也可以用二维列表来表示,即列表中的每个元素对应二维数据的一行,这个元素本身也是列表类型。
ls=[
['学生','身高','体重\n'],
['张三','170','60\n'],
['王五','178 ','80\n']
]
将CSV文件表示为二维列表对象
f=open("datas.csv","r")
ls=[]
for line in f:
line=line.replace("\n"," ")
ls.append(line.split(","))
f.close()
print(ls)
二维数据的遍历
使用二重循环遍历
for row in ls:
for item in row:
<处理该元素>
4.高维数据
高维数据可以由键值对组成的字典类型的数据作为列表元素构成,采用对象组织方式,可以多层嵌套,属于整合度更好的数据组织方式。
高维数据在网络系统中非常常用,HTML,XML,JSON等都是高维组织的语法结构
[{"姓氏":"凌","名字":"通","学院":"文学"},
{"姓氏":"高","名字":"乔","学院":"哲学"},
{"姓氏":"王","名字":"勃","学院":"工学"}]
#这就是对象组织方式