数据分析之数据重构

Task03:数据重构

数据从一种几何形态到另一种几何形态,数据从一种格式到另一种格式的转换,包括结构转换、格式转换、类型替换等(数据拼接、数据裁剪、数据压缩等),以实现空间数据在结构、格式、类型上的统一,多源和异构数据的联接与融合。
在这里插入图片描述

重构前存在的问题

一、使用难:主题表是由领域应用驱动设计的,定制性比较强,没有很好地考虑扩展和通用性,需求变化就很难重用。基于这些表进行再次汇聚、关联都比较困难。
二、质量差:相同指标在不同领域中的算法不统一,常存在数据一致性问题,数据质量差。
三、性能低: 所有的主题表都需要从原始表开始处理,不同主题数据之间存在很多相似的重复计算,整体性能低下。
四、开发慢: 应用需求的变化导致主题表结构频繁变化,并且需要从原始表重新处理,改动大,响应需求慢。
stack

df_obj = pd.DataFrame(np.random.randint(0,10, (5,2)), columns=['data1', 'data2'])
stacked = df_obj.stack()
# 默认操作内层索引
stacked.unstack()
# 通过level指定操作索引的级别
stacked.unstack(level=0)
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值