3.pandas常用数据结构series和方法

1、通过pandas.Series来创建Series(序列)数据结构。

pandas.Series(data,index,dtype,name).

上述参数中,data可以为列表,array或者dict.

上述参数中,index表示索引,必须与数据同长度,name代表对象名称

series1=pd.Series([2.8,3.01,8.99,8.59,5.18])
series2=pd.Series([2.8,3.01,8.99,8.59,5.18],index=['a','b','c','d','e'],name='这是一个series')
series3=pd.Series(np.array([2.8,3.01,8.99,8.59,5.18]),index=['a','b','c','d','e'])
series4=pd.Series({'北京':2.8,'上海':3.01,'广东':8.99,'江苏':8.59,'浙江':5.18})
实例:
import pandas as pd
import numpy  as np
#创建序列方式一
series1=pd.Series([2.8,3.01,8.99,8.59,5.18])#内容可以是列表、元组、字典
type(series1)#数据种类
结果:
pandas.core.series.Series#序列结果
series1:
0    2.80
1    3.01
2    8.99
3    8.59
4    5.18
dtype: float64
#创建序列方式二
series2=pd.Series([2.8,3.01,8.99,8.59,5.18],index=['a','b','c','d','e'],name='这是一个series')
series2:
a    2.80
b    3.01
c    8.99
d    8.59
e    5.18
Name: 这是一个series, dtype: float64
#创建序列方式三
#字典键作为行索引,字典值作为值
series3=pd.Series({'北京':2.8,'上海':3.01,'广东':8.99,'江苏':8.59,'浙江':5.18})
series3:
北京    2.80
上海    3.01
广东    8.99
江苏    8.59
浙江    5.18
dtype: float64
#如何访问?
#访问方式一通过位置访问元素,左闭右开
series3[0:3]
北京    2.80
上海    3.01
广东    8.99
#访问方式二通过索引标签访问元素,
series3["北京"]
2.8
series3["北京":"江苏"]
北京    2.80
上海    3.01
广东    8.99
江苏    8.59
dtype: float64
#输出值
series1.values#输出的是值,是数组结构
array([2.8 , 3.01, 8.99, 8.59, 5.18])
series1.index #输出序列的行索引
RangeIndex(start=0, stop=5, step=1)
series1.dtype#输出序列的数据类型
dtype('float64')
series3.index #输出序列的行索引
Index(['北京', '上海', '广东', '江苏', '浙江'], dtype='object')

 

Pandas是一个用于数据处理和分析的Python库。它提供了两个主要的数据结构Series和DataFrame。 Series是一个一维的标数组,类似于带有标签的数组。你可以使用方式创建一个Series: ```python import pandas as pd data = [1, 2, 3, , 5] series =.Series(data) ``` 是一个二维的表格型数据结构,可以看作是由多个组成的字典。你可以使用以下方式创建一个DataFrame: ```python import pandas as pd data = {'Name': ['John', 'Mike', 'Sarah'], 'Age': [28, 32, 25], 'City': ['New York', 'London', 'Paris']} df = pd.DataFrame(data) ``` 下面是一些常用Pandas数据处理方法: 1. 数据检索:你可以使用以下方式对Series和DataFrame进行数据检索和筛选: - 使用索引检索单个元素或切片:`series[0]`、`df['Name']` - 使用条件筛选:`df[df['Age'] > 30]` - 使用位置筛选:`df.iloc[0]` 2. 数据清洗:你可以使用以下方法清洗数据: - 缺失值处理:`df.dropna()`、`df.fillna(value)` - 重复值处理:`df.drop_duplicates()` 3. 数据转换:你可以使用以下方法对数据进行转换: - 类型转换:`df['Age'] = df['Age'].astype(float)` - 数据排序:`df.sort_values(by='Age')` - 数据分组:`df.groupby('City').mean()` 4. 数据计算:你可以使用以下方法进行数据计算: - 统计计算:`df.describe()`、`df.mean()` - 数值计算:`df['Age'] + 1`、`df['Age'].sum()` 这只是Pandas提供的一小部分方法,还有很多其他功能和方法可以帮助你进行数据处理和分析。你可以查阅Pandas官方文档以获取更详细的信息。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

DLANDML

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值