一、前言
对于在Deep Learning的学习中总会有几个数据类型的转换,这次想把这些常用的转换做一个总结,方便以后看。
这些主要包括:Dataframe、Series(pandas), array(numpy), list, tensor(torch)
二、定义
2.1 Dataframe和Series
这里简单介绍一下这两个结构。 Dataframe创建的方式有很多种,这里不赘述了。 以下举个例子,因为我们这里要讲的是和array等的转换,这里全都用数字型的元素。
对于dataframe来说,我们打印出来,结构类似于一个二维矩阵格式,只是每一列和每一个行都有个index,这并且这些结构之间有很多方便的操作,在读入结构化数据的时候尤为方便,所以平时做偏结构化数据的时候, 比如excel、pickle等等,pandas的使用是绕不开的。
而其中的series相当于dataframe的一个元素,如下。
Series只有row index,有点类似于一个一维向量。
而DataFrame既有行索引也有列索引,它也可以被看做由Series组成的字典(共同用一个索引
2.2 array
数组结构是由不同维度的list转换来的,用array的原因主要在于有更多的矩阵操作,数据使用起来更方便,比如转置、矩阵相乘、reshape等等。
2.3 tensor