pandas

一、Series类型
Series类型由一组数据及与之相关的数据索引组成。

创建:
1、列表
    a = pd.Series([5,4,3],index=['a','b','c'])
2、字典
    b = pd.Series({'a':5,'b':4,'c':3}, index=['c','a','b','d'])
    #按index顺序输出,d的值为NaN
3、从ndarray类型创建
    in:
        import pandas as pd
        import numpy as np
        c = pd.Series(np.arange(3),index=np.arange(9,6,-1))
        print(c)
    out:
        9    0
        8    1
        7    2
        dtype: int32
Series类型操作方法:
a.index  #获得索引
a.value  #获得数据
索引方法与ndarray类型一致
in操作:'c' in a  #会显示True或False
Series类型在运算中会自动对齐不同索引的数据

二、DataFrame类型
DataFrame是一个表格型的数据类型,既有行索引、也有列索引,常用于表达二维数据,是二维带“标签”数组。

DataFrame创建
1、从二维ndarray对象创建
    import pandas as pd
    import numpy as np
    d = pd.DataFrame(np.arange(8).reshape(2,4))
2、从一维ndarray对象字典创建
    dt = {'one':pd.Series([4,3,2], index=['a','b','c']),
          'two':pd.Series([9,8,7], index=['a','c','d'])}
    e = pd.DataFrame(dt)
    #数据根据行列索引自动补齐
3、从列表类型的字典创建
    dt = {'one':[5,4,3,2], 'two':[9,8,7,6]}
    f = pd.DataFrame(dt, index=['a','b','c','d'])
DataFrame类型操作:
1、重新索引:.reindex()能够改变或重排Series和DataFrame索引
    d = d.reindex(index=['c1','c2','c3','c4'], columns=['a4','a3','a2','a1'])
2、删除指定索引:
    d.drop(['a','c']) #同时删除两个索引需要[]
    d.drop('c5')

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值