一、pandas数据类型转换
1.object 转 float
1) lambda x: float(x[1:-1])
如:data[‘item_price’]列 :
$2.39 (object类型)转 2.39(float类型)
dollarizer = lambda x: float(x[1:-1])
data['item_price'] = data['item_price'].apply(dollarizer)
#转前:object
#转后:float64
二、pandas、numpy计数
1.unique()函数与nunique()函数
- unique()是以 数组形式(numpy.ndarray)返回列的所有唯一值(特征的所有唯一值)
- nunique() Return number of unique elements in the object.即返回的是唯一值的个数
order_id_nunique = data['order_id'].unique()
返回结果:[ 1 2 3 ... 1832 1833 1834]
order_id_nunique = data['order_id'].nunique()
返回结果:1834