pandas总结

官方文档

pandas修改值

http://pandas.pydata.org/pandas-docs/stable/getting_started/10min.html

饼图

    data = pandas.read_csv(data_path)
    status = data['marital-status']
    counts = status.value_counts()
    counts.plot(kind='pie',
                                figsize=(5, 6),
                                autopct='%1.f%%',  # add in percentages
                                startangle=90,         # start angle 90° (Africa)
                                # shadow=True,      # add shadow
                                )

    plt.title('marital-status')
    plt.axis('equal')  # Sets the pie chart to look like a circle.
    plt.show()

直方图

     data['age'].plot(kind='hist', rwidth=0.9)
     plt.xlabel("age")
     plt.ylabel("count")
     plt.show()

选取包含指定值的列
例如数据中有一列为income,如果我们想选择income=‘<=50K.’的记录,那么:

data_lt50 = data.loc[data['income']=='<=50K.']

数据离散化

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值