python数据分析必备工具(2)pandas(1)Series

2 篇文章 0 订阅
1 篇文章 0 订阅

Pandas —数据分析核心工具包

    import pandas as pd

Series

    1.Series 是一种带有标签的一维数组,可以保存任何数据类型,轴标签统称为索引
          ar=np.random.rand(5)
          s=pd.Series(ar)
          s.index #### s的索引
          s.values #### 数值  类型 ndarray
          相比ndarray ,是一个自带索引index的数组 --->对应索引 + 一维数组
          相比dict ,更像一个有序字典,索引原理与字典原理相似 key (index)---value
        Series创建方法
                 1:由字典创建,字典的key就是index,values就是values
                        dic={’a‘:1,'b':2,'c':3}
                        s=pd.Series(dic)
                  2. 通过一维数组创建
                         ar=np.random.rand(5)
                         s=pd.Series(ar,index=['a','b','c','d','e'])   ###index默认从0开始,指定index时必须和数据长度相同   
                  3.通过标量创建
                       s=pd.Series(100,index=range(4))   
        Series 索引:
                  1.下标索引:
                         s=pd.Series(np.random.rand(5))
                         s[2]
                   2. 标签索引:
                          s=pd.Series(np.random.rand(5),index=['a','b','c','d','e'])
                          s['a']  ###选取一个标签
                          s[['a','b']]  ###选取多个标签
           Series 	切片:
                         s[1:4]  ###使用下标 [1,4)
                         s['a':'e']   ###使用标签['a', 'e']
                    3. 布尔值索引:
                         s>2 返回布尔值
                         s[s>2]
           Series 数据查看:
                      s=pd.Series(np.random.rand(5))
                      s.head() ####默认查看前5条
                      s.tail()
            
              Series 重新索引:
                      s=pd.Series(np.random.rand(5),index=['a','b','c','d','e'])
                      s.reindex([]) ####根据新的索引重新排序,当索引不存在时引入缺失值(fill_value=0) 缺失值重新填充为0
                 Series 对齐:
                               s=pd.Series(np.random.rand(5),index=['a','b','c','d','e'])
                               s1=pd.Series(np.random.rand(5),index=['a','f','c','d','g'])
                               s+s1 #####按照索引对齐,然后进行相加
                  Series 删除:
                              s=pd.Series(np.random.rand(5),index=['a','b','c','d','e'])
                              s.drop('e')
                              s.drop(['e','a']) ##inplace=False 不会改变原数据,返回副本 
                                                    ###inplace=True 会改变原数据 
                   
                    Series 添加:
                              s=pd.Series(np.random.rand(5),index=['a','b','c','d','e'])
                              s['f']=100
                              s2=s.append(s1)
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值