38 pandas统计分析基础--Series

Pandas是Python的数据分析利器,其核心数据结构包括Series和DataFrame。Series类似于一维数组,拥有数据和相关索引。可通过字典创建Series,并通过索引访问数据。Series与Numpy操作兼容,支持缺失数据处理,且在运算时自动对齐索引。isnull和notnull函数用于检查缺失值,Series的name属性在数据分析中具有重要意义。
摘要由CSDN通过智能技术生成

简介

Pandas是Python下最强大的数据分析和探索工具。名称来自于面板(PanelData)和Python数据分析(DataAnalysis)。支持类似于SQL的数据增、删、改、查,并带有丰富的数据处理函数。支持时间序列分析功能,支持灵活处理缺失数据。

统计分析几乎贯穿了整个数据分析的流程,即运用统计方法,将定量与定性结合,进行的研究活动。统计分析除了包含单一数值型特征的数据集中趋势、分散趋势和峰度与偏度等统计知识外,还包含了多个特征比较计算等知识。

一.pandas的数据结构介绍

要使用pandas,就要先熟悉它的两个主要数据结构:Series和DataFrame。

1.Series

  • 创建
    Series是一种类似于一维数组的对象,它由一组数据(各种Numpy数据类型)以及一组与之相关的数据标签(即索引)组成。
    仅仅由一组数据就可以产生最简单的Series
import pandas as pd

obj = pd.Series([1, 2, 3, 90])
print(obj)

在这里插入图片描述Series的字符串表现形式为:索引在左边,值在右边。 由于没有为数据指定索引,于是会自动创建一个0到N-1(N为数据长度)的整数型索引。

  • 属性
    可以通过Series的values和index属性获取其数组表示形式和索引对象:
import pandas as pd

obj = pd.Series([1, 2, 3, 90])
print(obj.values)
print(obj.index)

在这里插入图片描述

  • 通常,我们希望创建的Series带有一个可以堆各个数据点进行标记的索引:
import pandas as pd

obj2 = pd.Series([1, 2, 3, 90], index=['a', 'b', 'c', 'd'])
print
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值