Pandas Series

最新推荐文章于 2024-05-01 00:39:45 发布

南风有翼

最新推荐文章于 2024-05-01 00:39:45 发布

阅读量172

点赞数

分类专栏： Python

本文链接：https://blog.csdn.net/sunshine123moon/article/details/90343123

版权

Python 专栏收录该内容

22 篇文章 1 订阅

订阅专栏

Series与numpy的ndarray相比，多了一些更好用的函数，如：describe()
与ndarray相似的地方：

下标方式访问：s[10]、s[3:10]...

for循环：for item in s

向量计算：+、-、*、/...

科学函数：mean\sum\max...

比python list快

import pandas as pd
a=pd.Series([1,2,3,4,5,6,7,8,9,10])
a.describe()

count    10.00000   ---个数
mean      5.50000   ---均值
std       3.02765   ---方差
min       1.00000   ---最小值
25%       3.25000   ---1/4处，第一四分位点
50%       5.50000   ---2/4处，第二四分位点
75%       7.75000   ---3/4处，第三四分位点
max      10.00000   ---最大值
dtype: float64      ---数据类型

print (a[2])
for i in a:
    print (i)
a.mean()

import pandas as pd
def re_judge(var1,var2):#定义判断函数
    mean1=var1.mean() #定义变量的均值
    mean2=var2.mean() 
    #same_re也是一个由若干变量组成了series,其中的具体变量为true或false
    same_re=((var1>mean1)&(var2>mean2)|((var1<mean1)&(var2<mean2)))#都大于或都小于均值则返回到same_re
    print (same_re) #打印返回的series
    return(len(same_re[same_re==True]),len(same_re[same_re==False]))#返回满足上述相关条件的元素个数，返回的元组
area=pd.Series([67.5,32,135,84,200,62,101,25])
price=pd.Series([550,260,800,620,1300,902,1100,400])
print (re_judge(area,price))#打印（相关性强的数据个数，相关性弱的数据个数）
print (area.mean())
print (price.mean())

0     True
1     True
2     True
3     True
4     True
5    False
6     True
7     True
dtype: bool
(7, 1)
88.3125
741.5

南风有翼

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录