数据划分处理（基于python的pandas中的dataframe数据结构）

Cameback_Tang

已于 2023-10-06 11:43:07 修改

阅读量1.5k

点赞数

文章标签： pandas python 数据划分处理 dataframe

于 2019-11-02 23:30:34 首次发布

本文链接：https://blog.csdn.net/cameback_tang/article/details/102876947

版权

数据划分处理（基于python的pandas中的dataframe数据结构）

我们常常需要从一个表格中，得到相关的子表格。

正如问题：按国家，从原始资源表中得到金银铜的年储量变化。（如图所示）

比较简单的做法可以是：多重循环

但小编往往不会满足于这样的处理方式，相反更偏向于使用相关的已有的函数，对整个表格同时进行处理。

分析上述实际问题，如果先按国家（魏、蜀、吴）划分为三个数据集，则储量可由（资源名、年份）唯一确定。

正如 df['金']['1960'] = 11，其中df为事先生成的空的dataframe。

data_Shu = data[data['国家'] == '蜀']
data_Wu = data[data['国家'] == '吴']
data_Wei = data[data['国家'] == '魏']

data_Shu的结果为：

资源名国家年份储量
0 金蜀

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

Cameback_Tang

关注关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

DataFrame 数据集切分

smallTutou的博客

11-08

2903

DataFrame 数据集切分 #方式1 from sklearn.model_selection import train_test_split # split train set and test set data_train, data_test = train_test_split(data, test_size=0.2, random_state=1234) # split validate set and test set data_test, data_val = train_test_s

python将一个list、dataframe、一维矩阵等分成若干段

yigeng3663的博客

05-08

1804

c = thF['ai1'] #可为list，矩阵dataframe的列 step = 20000 d = [c[i:i + step] for i in range(0, len(c), step)] print (d)

1 条评论您还未登录，请先登录后发表或查看评论

用pandas划分数据集——训练集和测试集

热门推荐

MDbabyface的博客

10-22

3万+

用pandas划分数据集——训练集和测试集

最简单的Python数据集分割：将Dataframe自由分割成指定大小的test和train

一起学习 | Study Together

03-19

3688

kflod，cross_validation等函数包提供了很好的“成比例分割数据集”的方法，但是当我们希望获得指定大小的数据集时，应该怎么做呢？

python划分数据集用pandas_Python数据分析工件-pandas（高级教程）,神器,进阶

weixin_33751197的博客

02-10

561

合并数据集pandas对象中的数据可以通过一些内置的方式进行合并：pandas.merge 可以根据一个或多个键将不同DataFrame中的行连接起来pandas.concat 可以沿着一条轴将多个对象堆叠到一起实例方法 combine_first 可以将重复数据连接在一起，用一个对象中的值填充另一个对象中的缺失值默认情况下，merge做的是“inner”连接，结果中的键是交集。其他方式还有“l...

python数据分析的基础知识—pandas中dataframe()使用

sodaloveer的博客

08-03

1355

pandas中dataframe()使用

pandas中DataFrame数据合并及分组

weixin_47844457的博客

05-07

1757

数据合并 join() 将行索引相同的数据合并在一起；举例：import pandas as pd import numpy as np df_1 = pd.DataFrame({ 'A':[1, 2, 3, 4], 'B':[1, 2, 3, 4], 'C':[1, 2, 3, 4], 'D':[1, 2, 3, 4], 'E':[1, 2, 3, 4] }) df_2 = pd.DataFrame({ 'f':[1, 2, 3],

Python数据处理——pandas

LongXinKou的博客

02-15

3688

文章目录0. 基本概念Series（一）创建Series（二）Series的简单操作DataFrame（一）创建DataFrame1. 数据选取2. 加载数据3. 排序与合并4. 数据汇总5. 时间序列 0. 基本概念 Pandas的数据类型是一张表，可以把Pandas理解为内存型的数据库。 import pandas as pd Series：列 DataFrame：表 Series （一）创建Series 1. 使用列表list创建Series （1）默认列表索引从0 - n-1 # 使用列表List

python使用pandas模块介绍以及使用，dataframe结构，Series结构，基本数据操作,DataFrame运算，pandas画图，存储，缺失值处理，离散化，合并

weixin_55579895的博客

10-12

6946

目录1 pandas介绍1.1 Pandas介绍1.2 为什么使用Pandas1.3 案例：在numpy当中创建的股票涨跌幅数据形式1.4 DataFrame1.4.1 DataFrame结构1.4.2 DatatFrame的常用属性和方法 1 pandas介绍 1.1 Pandas介绍面板数据（三维数据）分析计量经济学（数据分析80% 跑计量20%）以Numpy为基础，借力Numpy模块在计算方面性能高的优势基于matplotlib，能够简便的画图独特的数据结构 1.2 为什么使用Pa

pandas_dataset:Pandas DataFrame扩展可分析数据集以进行分类

03-08

:hot_beverage: 分类数据集的工具该Pandas扩展提供了其他工具来分析和处理机器学习中分类任务的数据集。它是对其他框架（例如PyTorch或FastAI）的有用补充。 :fast_down_button: 安装通过运行以下命令，可以直接从github存储库安装此模块： !pip install --upgrade git+git://github.com/diogodutra/pandas_dataset.git 接下来，在导入Pandas之后，将pdds模块导入到您的Python代码中： import pandas as pd from pdds import pdds 或者，可以将存储库克隆到本地文件夹，但是导入有点麻烦，本教程不涉及。 :laptop: 用法现在，您的Pandas DataFrames在新的dataset名称空间中被添加了其他方法，如下面的示例所示： df = pd.DataFrame() (df.datas

用pandas划分数据集实现训练集和测试集

12-17

1、使用model_select子模块中的train_test_split函数进行划分数据：使用kaggle上Titanic数据集划分方法：随机划分 # 导入pandas模块，sklearn中model_select模块 import pandas as pd from sklearn.model_select import train_test_split # 读取数据 data = pd.read_csv('.../titanic_dataset/train.csv') # 将特征划分到 X 中，标签划分到 Y 中 x = data.iloc[:, 2:] y = data.l

4.9 Pandas中的Dataframe 数据分组（Python）

蚊者逆袭的博客

02-10

4602

根据统计研究的需要，将原始数据按照某种标准划分成不同的组别，分组后的的数据称为分组数据。

python Dataframe pandas 将数据分割成时间跨度相等的数据块

llwang_10的专栏

11-21

1万+

Python Dataframe pandas 将数据分割成时间跨度相等的数据块有如下dataframe格式的数据，列名分别为date、ip，我需要统计每5s内出现的ip，以及这些ip出现的频数。

python里数据框拆分,如何使用python拆分数据框来创建组

weixin_42358827的博客

12-17

144

My dataframe:df:order quantityA 1B 1C 2D 3E 3F 4My goal is to create a group fro...

pandas基于dataframe特定数据列的指定阈值将原dataframe分割成两个dataframe(split dataframe based on column value threshold

data+scenario+science+insight

03-17

2238

pandas基于dataframe特定数据列的指定阈值将原dataframe分割成两个子dataframe(splitdataframe based on column value threshold)

Python DataFrame 根据时间进行切分/分割/groupby数据