第二章：02数据重构

最新推荐文章于 2023-01-21 11:25:44 发布

小新儿

最新推荐文章于 2023-01-21 11:25:44 发布

阅读量802

点赞数

分类专栏： kaggle实战—泰坦尼克（二、数据清洗及特征处理）文章标签：数据分析

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_44964457/article/details/118863103

版权

1.了解数据重构的方法2.学会使用groupby作数据运算什么是数据重构？数据重构:指数据从一种格式到另一种格式的转换，包括结构转换、格式变化、类型替换等，以解决空间数据在结构、格式和类型上的统一，实现多源和异构数据的联接与融合。合并数据集stack使用pandas进行数据重排时，经常用到stack和unstack两个函数。stack的意思是堆叠，堆积，unstack即“不要堆叠”。常见的数据层次化结构有：花括号和表格。表格在行列方向上均有索引（类似于DataFrame）。.

摘要由CSDN通过智能技术生成

1.了解数据重构的方法

2.学会使用groupby作数据运算

什么是数据重构？
数据重构:指数据从一种格式到另一种格式的转换，包括结构转换、格式变化、类型替换等，以解决空间数据在结构、格式和类型上的统一，实现多源和异构数据的联接与融合。

合并数据集
stack

使用pandas进行数据重排时，经常用到stack和unstack两个函数。stack的意思是堆叠，堆积，unstack即“不要堆叠”。
常见的数据层次化结构有：花括号和表格。

表格在行列方向上均有索引（类似于DataFrame）。
花括号结构只有“列方向”上的索引（类似于层次化的Series）。
stack函数会将数据从”表格结构“变成”花括号结构“，即将其行索引变成列索引，反之，unstack函数将数据从”花括号结构“变成”表格结构“，即要将其中一层的列索引变成行索引。
stack:stack函数会将数据从”表格结构“变成”花括号结构“ ，将列索引转为行索引，完成层级索引
unstack:unstack函数将数据从”花括号结构“变成”表格结构“，层级索引展开，默认操作内层索引

df_obj = pd.DataFrame(np.random.randint(0,10, (5,2)), columns=['data1', 'data2'])
df_obj

stacked = df_obj.stack()
print(stacked)

stackedd=stacked.unstack()
print(stacked)

代码结果如下所示·：

concat

Pandas中的pd.concat与np.concatenate类似，但可选参数更多，功能更为强大。

pd.concat可以简单地合并一维的对象：

ser1 = pd.Se

最低0.47元/天解锁文章

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
第二章：02数据重构

1.了解数据重构的方法2.学会使用groupby作数据运算什么是数据重构？数据重构:指数据从一种格式到另一种格式的转换，包括结构转换、格式变化、类型替换等，以解决空间数据在结构、格式和类型上的统一，实现多源和异构数据的联接与融合。合并数据集stack使用pandas进行数据重排时，经常用到stack和unstack两个函数。stack的意思是堆叠，堆积，unstack即“不要堆叠”。常见的数据层次化结构有：花括号和表格。表格在行列方向上均有索引（类似于DataFrame）。.
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。