Pandas dtypes

https://pandas.pydata.org/docs/user_guide/basics.html#dtypes

概念

1)按大类型分

类型类型对象类型创建简称
数字Int64Dtype,…直接写‘Int8’, ‘Int16’, ‘Int32’, ‘Int64’, ‘UInt8’, ‘UInt16’, ‘UInt32’, ‘UInt64’,float16, float32, float64, float128
时间DatetimeTZDtypeTimestampdatetime64[ns, <tz>],timedelta64[ns]
字符串StringDtypestr‘string’
布尔BooleanDtypebool‘boolean’

2)按小类型分
numeric类型缺失值是np.NaN而datetime和timedelt类型的缺失值是pd.NaT,这是两个特殊的值.不能用来做布尔等值判断,也即是说np.NaN == np.NaN返回值为False,pd.NaT也是一样的.
np.NaN可以转换为None,而pd.NaT不能转换为None

类型缺失值描述
intnp.NaNint8, int16, int32, int64
floatnp.NaN
boolbool
objectstring
timedeltapd.NaT
datatimepd.NaTdatetime64[ns]

转换

pandas使用object类型存储字符串,如果一列有多个类型,也是用object存储,这时每个单元格保持自己的类型
没有str类型,需要使用astype('str''')来转换,

数据转换描述
to_numeric()转换为numeric类型(int,float),然后通过astype转换为bool类型
to_datetime()转换为datetime类型(datetime64[ns]),就是时间戳
to_timedelta()转换为timedelta(timedelta64[ns])
astype(‘object’)转换为字符串类型

使用转换函数可以传递error参数,

参数值描述
errors=‘raise’默认,任何转换错误都会终止
errors=‘coerce’忽略错误,并将有问题的数据进行如下转换:时间格式转换为pd.NaT,numeric转换为np.nan
errors=‘ignore’忽略错误,并且不做任何转换

https://pandas.pydata.org/pandas-docs/stable/getting_started/basics.html#defaults

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值