pandas 对列进行替换值和删除列 设置Series的dtype 统计Series 里面数值类型和个数...

def preprocess2():
    """
    数据预处理
    :return:
    """

    data = pd.read_csv('./dataset/preprocess_1',
                       delimiter=',', header=None
                       , names=['licheng', 'youxi', 'bingbang', 'xihuang'])

    print(data.describe())
    tmpa = data['xihuang']
    # 统计种类
    a = tmpa.value_counts(dropna=False)
    xihuangmaping = {"didntLike": 1, "smallDoses ": 2, "largeDoses": 3, 'smallDoses': 0}

    data['xihuang'] = data['xihuang'].map(xihuangmaping)
    data['xihuang'] = data['xihuang'].astype(np.int16)
    data['xihuang'] = data['xihuang'].astype(np.int16)
    data.to_csv('./dataset/preprocess_2', index=None)

转载于:https://my.oschina.net/marjeylee/blog/1513801

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: 是的,在 Pandas 中,可以使用 `.keys()` 方法将 `Series` 的索引提取出来,使用 `.values` 属性将 `Series` 的提取出来。例如: ```python import pandas as pd s = pd.Series([1, 2, 3, 4], index=['a', 'b', 'c', 'd']) keys = s.keys() print(keys) # Output: Index(['a', 'b', 'c', 'd'], dtype='object') values = s.values print(values) # Output: [1 2 3 4] ``` 在上面的代码中,我们首先创建了一个名为 `s` 的 `Series`,其中索引为 `'a'`、`'b'`、`'c'` 和 `'d'`,分别为 1、2、3 和 4。然后,我们使用 `.keys()` 方法将索引提取出来,使用 `.values` 属性将提取出来。 ### 回答2: 是的,pandasSeries可以将它的键和分别提取出来。 对于Series对象,它由一组键和一组相应的组成。我们可以通过Series对象的index属性访问键,通过values属性访问。 例如,我们有一个Series对象data,它包含了一些城市的人口信息。我们可以使用data.index来获取所有城市的名称,使用data.values来获取对应城市的人口数。这样,我们就能够将键和分开提取出来。 另外,还可以使用iteritems()方法来分别遍历Series的键和。这个方法返回一个迭代器,每次迭代返回键对的元组(tuple)。我们可以通过这种方式将键和分别提取出来,并进行进一步的处理。 总而言之,pandasSeries对象既可以将键和一起访问,也可以将它们分别提取出来,并对它们进行相应的操作。 ### 回答3: pandas.core.series.Seriespandas库中的一个数据结构,它代表着一列数据,类似于Excel中的一列。不仅可以提取出Series,还可以提取出Series的键,分别存储在索引和个数组里。 通过Series对象的index属性,可以获得Series的索引数组。索引是对Series数据进行标记的标签,可以是整数、字符串、日期等等。例如,如果有一个Series数据表示学生的成绩,它可以有索引数组['Alice', 'Bob', 'Cindy'],分别对应学生的姓名。 通过Series对象的values属性,可以获得Series数组。数组是一个一维的NumPy数组,存储了Series数据的实际。 例如,有一个Series数据如下: ``` import pandas as pd data = {'Alice': 80, 'Bob': 70, 'Cindy': 90} s = pd.Series(data) ``` 这个Series的索引数组为['Alice', 'Bob', 'Cindy'],数组为[80, 70, 90]。可以通过调用s.index和s.values分别提取出索引和。 所以,pandas.core.series.Series提供了提取键和的方法,分别通过index和values属性。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值