Pandas统计分析基础(基础篇,新手必看)

本文详细介绍了Pandas的基础知识,包括数据结构Series、DataFrame和索引对象,讲解了如何进行数据查询、编辑、运算、分组聚合以及数据透视表的操作。此外,还探讨了Pandas的数据可视化,如线形图、柱状图、直方图和散点图的绘制,是Python数据分析新手的必备教程。
摘要由CSDN通过智能技术生成

Pandas统计分析基础

Pandas(Python Data Analysis Library)是基于NumPy的数据分析模块,它提供了大量标准数据模型和高效操作大型数据集所需的工具,可以说Pandas是使得Python能够成为高效且强大的数据分析环境的重要因素之一。

导入方式:import pandas as pd

Pandas有三种数据结构:Series、DataFrame和Panel。Series类似于一维数组;DataFrame是类似表格的二维数组;Panel可以视为Excel的多表单Shee

一、Pandas中的数据结构

1.Series

Series 是一种一维数组对象,包含了一个值序列,并且包含了数据标签,称为索引(index),可通过索引来访问数组中的数据。

Series的创建:

pd.Series(data=None, index=None, dtype=None, name=None, copy=False, fastpath=False)

通过列表创建Series:

import pandas as pd
obj = pd.Series([1, -2, 3, -4]) #仅有一个数组构成
print(obj)

在这里插入图片描述
创建Series时指定索引:

i = ["a", "c", "d", "a"]
v = [2, 4, 5, 7]
t = pd.Series(v, index = i, name = "col")
print(t)

在这里插入图片描述
尽管创建Series指定了index参数,实际Pandas还是有隐藏的index位置信息的。所以Series有两套描述某条数据的手段:位置和标签.

Series位置和标签的使用:
在这里插入图片描述
在这里插入图片描述
通过字典创建:

如果数据被存放在一个Python字典中,也可以直接通过这个字典来创建Series。

sdata = {
   'Ohio': 35000, 'Texas': 71000, 'Oregon': 16000, 'Utah': 5000}
obj3 = pd.Series(sdata)
print(obj3)

在这里插入图片描述
键值和指定的索引不匹配:

sdata = {
   "a" : 100, "b" : 200, "e" : 300}
letter = ["a", "b","c"  , "e" ]
obj =  pd.Series(sdata, index = letter)
print(obj)

在这里插入图片描述
不同索引数据的自动对齐:

sdata = {
   '
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

黎明之道

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值