第275篇原创
2.3 通用解析框架
dtype
承接前文,test.csv读入后数据框如下:
In [6]: df = pd.read_csv('test.csv',sep='\s+')
In [7]: df
Out[7]:
id id.1 age
0 1 'gz' 10
1 2 'lh' 12
使用dtypes查看每一列的数据类型,如下:
In [8]: df.dtypes
Out[8]:
id int64
id.1 object
age int64
dtype: object
如果我想修改age列的数据类型为float,read_csv时可以使用dtype调整,如下:
In [9]: df = pd.read_csv('test.csv',sep='\s+',dtype={ 'age':float})
In [10]: df
Out[10]:
id id.1 age
0 1 'gz' 10.0
1 2 'lh' 12.0
In [11]: df.dtypes
Out[11]:
id int64
id.1 object
age float64
dtype: object
这个参数有用之处可能体现在如下这个例子,就是我某列的数据:
label
01
02
如果不显示的指定此列的类型str, read_csv解析引擎会自动判断此列为整形,如下在原test.csv文件中增加上面一列,如果不指定dtype, 读入后label列自动解析为整型
In [48]: df = pd.read_csv('test.csv',sep='\s&#