pandas 对列进行替换值和删除列 设置Series的dtype 统计Series 里面数值类型和个数...

def preprocess2():
    """
    数据预处理
    :return:
    """

    data = pd.read_csv('./dataset/preprocess_1',
                       delimiter=',', header=None
                       , names=['licheng', 'youxi', 'bingbang', 'xihuang'])

    print(data.describe())
    tmpa = data['xihuang']
    # 统计种类
    a = tmpa.value_counts(dropna=False)
    xihuangmaping = {"didntLike": 1, "smallDoses ": 2, "largeDoses": 3, 'smallDoses': 0}

    data['xihuang'] = data['xihuang'].map(xihuangmaping)
    data['xihuang'] = data['xihuang'].astype(np.int16)
    data['xihuang'] = data['xihuang'].astype(np.int16)
    data.to_csv('./dataset/preprocess_2', index=None)

转载于:https://my.oschina.net/marjeylee/blog/1513801

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值