Pandas dtypes(数据类型)

http://pandas.pydata.org/pandas-docs/stable/basics.html?highlight=astype#selecting-columns-based-on-dtype
Pandas所支持的数据类型:
1. float
2. int
3. bool
4. datetime64[ns]
5. datetime64[ns, tz]
6. timedelta[ns]
7. category
8. object
默认的数据类型是int64,float64.

查看数据类型

  1. df.dtypes
  2. series.dtype
  3. get_dtype_counts()
    如果一列中含有多个类型,则该列的类型会是object,同样字符串类型的列也会被当成object类型.
    不同的数据类型也会被当成object,比如int32,float32

通过列类型选取列

select_dtypes()

 DataFrame.select_dtypes(include=None, exclude=None)

参数

  1. include, exclude : list-like(传入想要查找的类型)

返回

  1. subset : DataFrame

Raises

  1. ValueError
  2. TypeError

转换列类型

DataFrame.astype$Series.astype

Series.astype(dtype, copy=True, errors=’raise’, **kwargs)
DataFrame.astype(dtype, copy=True, errors=’raise’, **kwargs)

参数

  1. dtype : data type, or dict of column name -> data type(传入列名和类型的字典)
  2. errors : {‘raise’, ‘ignore’}, default ‘raise’.(ignore,强制转换,这样不会报错,可以识别不同类型的数据)
  3. kwargs : keyword arguments to pass on to the constructor

返回

  1. casted : type of caller

Index.astype

Index.astype(dtype, copy=True)

参数

  1. dtype : numpy dtype or pandas type
  2. copy : bool, default True

其他转换方法

to_numeric() (conversion to numeric dtypes)
to_datetime() (conversion to datetime objects)
to_timedelta() (conversion to timedelta objects)

评论 16
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值