python从字符串中提取数字并转换为相应数据类型_在pandas中将字符串/数字数据转换为分类格式...

我有一个非常大的csv文件,我把它转换成了Pandas dataframe,它有字符串和整数/浮点值。我想把这些数据改成分类格式,这样可以节省一些内存。我的想法是基于这里的文档:https://pandas.pydata.org/pandas-docs/version/0.20/categorical.html

我的数据帧如下所示:clean_data_measurements.head(20)

station date prcp tobs

0 USC00519397 1/1/2010 0.08 65

1 USC00519397 1/2/2010 0.00 63

2 USC00519397 1/3/2010 0.00 74

3 USC00519397 1/4/2010 0.00 76

5 USC00519397 1/7/2010 0.06 70

6 USC00519397 1/8/2010 0.00 64

7 USC00519397 1/9/2010 0.00 68

8 USC00519397 1/10/2010 0.00 73

9 USC00519397 1/11/2010 0.01 64

10 USC00519397 1/12/2010 0.00 61

11 USC00519397 1/14/2010 0.00 66

12 USC00519397 1/15/2010 0.00 65

13 USC00519397 1/16/2010 0.00 68

14 USC00519397 1/17/2010 0.00 64

15 USC00519397 1/18/2010 0.00 72

16 USC00519397 1/19/2010 0.00 66

17 USC00519397 1/20/2010 0.00 66

18 USC00519397 1/21/2010 0.00 69

19 USC00519397 1/22/2010 0.00 67

20 USC00519397 1/23/2010 0.00 67

这是另外2700行的降水数据。因为它都是同一个类别(站号),所以应该可以转换成分类格式,这样可以节省处理时间。我只是不知道怎么写代码。有人能帮忙吗?谢谢。在

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值