python中pandas的两种数据结构+pandas统计分析

缱绻命运

已于 2022-04-13 18:55:39 修改

阅读量1.1k

点赞数 1

分类专栏： python知识点文章标签： python

于 2022-04-11 23:10:57 首次发布

本文链接：https://blog.csdn.net/m0_67601373/article/details/124111343

版权

python知识点专栏收录该内容

26 篇文章 1 订阅

订阅专栏

pandas中的核心数据结构是序列Series和数据框DataFrame；

Series类似于numpy中的一维数组；DataFrame类似于numpy中的二维数组。

Series是个定长的字典序列，有两个默认属性：索引index和数据values，索引默认是从0开始，也可以自己指定索引。

Series输出包含两列，索引列和数据列，如下图，左边是索引列，右边是数据列。

数据可以通过索引来获取，例如a[索引]=数据，通过索引获取数据。

import pandas as pd
from pandas import Series,DataFrame
a = Series([1,2,3,4])
#不指定index索引，则默认索引从0开始
b = Series(data = [1,2,3,4],index = ['a','b','c','d'])
#指定index索引


print(a)
print(b)



#通过索引获取元素值
print(a[3]) #这里的3是索引号，索引3对应的是“4”这个元素
print(b['b'])   #这里的‘b’是索引号，‘b’对应的是2这个元素
print(a[[1,3]])
#a中的索引1和索引3的元素，索引号和值对应输出