pandas 对列进行替换值和删除列设置Series的dtype 统计Series 里面数值类型和个数...

最新推荐文章于 2023-09-30 18:00:26 发布

weixin_34342905

最新推荐文章于 2023-09-30 18:00:26 发布

阅读量1.8k

点赞数

文章标签： python

原文链接：https://my.oschina.net/marjeylee/blog/1513801

版权

2019独角兽企业重金招聘Python工程师标准>>>

def preprocess2():
    """
    数据预处理
    :return:
    """

    data = pd.read_csv('./dataset/preprocess_1',
                       delimiter=',', header=None
                       , names=['licheng', 'youxi', 'bingbang', 'xihuang'])

    print(data.describe())
    tmpa = data['xihuang']
    # 统计种类
    a = tmpa.value_counts(dropna=False)
    xihuangmaping = {"didntLike": 1, "smallDoses ": 2, "largeDoses": 3, 'smallDoses': 0}

    data['xihuang'] = data['xihuang'].map(xihuangmaping)
    data['xihuang'] = data['xihuang'].astype(np.int16)
    data['xihuang'] = data['xihuang'].astype(np.int16)
    data.to_csv('./dataset/preprocess_2', index=None)

转载于:https://my.oschina.net/marjeylee/blog/1513801