python 中 series常用操作

1. 两个series 合并 dataframe ----pd.concat()

df_concat_resample = pd.concat([nr_in_27, nr_in_103], axis=1, ignore_index=False)

首先创建两个Series对象为例

首先要提醒的是,DataFrame对象的每一列都可以看做是一个Series对象
换句话说,DataFrame对象可以看做是多个Series对象拼接而成

在这里插入图片描述


在这里插入图片描述
concat()函数里面有两个常用的参数axis 和ignore_index, 默认值分别为axis=0, ignore_index=False, axis=0表示行拼接,axis=1表示列拼接

  1. 首先尝试直接对 s1s2 使用 pd.concat([s1, s2], axis=0, ignore_index=False),会发现这样会直接把s1和s2进行简单的行拼接————拼成一列
    在这里插入图片描述
  2. 对s1和s2使用pd.concat([s1, s2], axis=1, ignore_index=False),结果是把s1和s2中具有相同索引的值进行了拼接, 最后的结果变成了一个具有两列的DataFrame对象
    在这里插入图片描述

2. pd.Series 之间的相关运算

在这里插入图片描述

3. DataFrame和Series的简单运算(加减乘除)

3.1 先运行下面的程序

import numpy as np
import pandas as pd
from pandas import Series, DataFrame

# 下面两个方法都可以
# frame = DataFrame(np.arange(9).reshape(3,3), columns=list('abc'), index=['one', 'two', 'threee'])
frame = DataFrame(np.arange(9).reshape(3,3), columns=['a','b','c'], index=['one', 'two', 'threee'])
# print(frame)

series = frame['b']
# print(series)

3.2 然后在Python Console交互

frame和Series如下:

In[3]: frame
Out[3]: 
        a  b  c
one     0  1  2
two     3  4  5
threee  6  7  8

In[4]: series
Out[4]: 
one       1
two       4
threee    7
Name: b, dtype: int32

下面是运算交互:

DataFrame.operate(Series, axis=0)

In[5]: frame.add(series, axis=0)
Out[5]: 
         a   b   c
one      1   2   3
two      7   8   9
threee  13  14  15

In[6]: frame.sub(series, axis=0)
Out[6]: 
        a  b  c
one    -1  0  1
two    -1  0  1
threee -1  0  1
In[7]: frame.mul(series, axis=0)
Out[7]: 
         a   b   c
one      0   1   2
two     12  16  20
threee  42  49  56

In[8]: frame.div(series, axis=0)
Out[8]: 
               a    b         c
one     0.000000  1.0  2.000000
two     0.750000  1.0  1.250000
threee  0.857143  1.0  1.142857
  • 6
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
当涉及到使用Python进行数据分析时,pandas库DataFrame是一个非常强大和常用的工具。下面是一些常见的DataFrame操作: 1. 创建DataFrame: - 从列表或数组创建DataFrame:使用`pd.DataFrame()`函数,传入列表或数组。 - 从字典创建DataFrame:使用`pd.DataFrame()`函数,传入字典。 2. 查看DataFrame: - 查看前几行数据:使用`df.head(n)`,默认显示前5行。 - 查看后几行数据:使用`df.tail(n)`,默认显示后5行。 - 查看列名:使用`df.columns`。 - 查看索引:使用`df.index`。 - 查看数据类型:使用`df.dtypes`。 3. 选择数据: - 选择列:使用`df['column_name']`,返回Series对象。 - 选择多列:使用`df[['column1', 'column2']]`,返回DataFrame对象。 - 选择行:使用`.loc[]`或`.iloc[]`索引器,根据标签或位置选择行。 - 使用条件选择数据:使用布尔索引,如`df[df['column'] > 10]`。 4. 数据处理: - 添加列:使用`df['new_column'] = values`,可以将一个常量值或一个Series对象赋值给新列。 - 删除列:使用`df.drop(columns=['column1', 'column2'])`,可以删除指定的列。 - 修改列名:使用`df.rename(columns={'old_name': 'new_name'})`,可以修改指定列的名称。 - 处理缺失值:使用`df.dropna()`删除包含缺失值的行,使用`df.fillna(value)`填充缺失值。 5. 数据统计: - 汇总统计:使用`df.describe()`,返回关于数据的统计信息。 - 计算均值:使用`df.mean()`计算列的均值。 - 计算总和:使用`df.sum()`计算列的总和。 - 计算最大值、最小值、位数:使用`df.max()`、`df.min()`、`df.median()`等。 6. 数据排序: - 按列排序:使用`df.sort_values(by='column')`,可以按照指定的列对数据进行排序。 - 按索引排序:使用`df.sort_index()`,可以按照索引对数据进行排序。 7. 数据分组和聚合: - 使用`df.groupby('column')`进行分组,然后可以对分组后的数据进行聚合操作,如求和、平均值等。 这只是一些常见的DataFrame操作,还有很多其他功能可以在pandas文档找到。希望这些常用操作对你在数据分析有所帮助!
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值