[python]data8Week5反思

本文介绍了在数据处理中如何使用Table的column操作,如合并(pivot和join)、数值与类别数据的处理,以及根据数据关系选择合适的图表类型(如绝对与相对关系的hist,plot,scatter,barh)。
摘要由CSDN通过智能技术生成

有肌肉记忆了,但是还是很混乱我需要理清哪个是哪个

数据是Table,有column,有label和value

Table.column('label') == value

这时候会出现表合并,因为raw数据可能不够

- 自我合并 : group, select, drop, pivot

-- pivot categorical + categorical = 组合category, numerical col加上去,返回的是lst, 是numerical value的集合 t.pivot(cols, rows, vals = None , function_name = None)

-- group t.group([column, …], function_name = None) or just one col but not list

- 外部合并:  join

--  join是一种补充信息,是数据库里面的主键和外键 链接,如果全是numerical,想添加categorical, 那就是用join来做外键对应,方便可视化

下位概念是 column 

Table can

apply function to col, table.apply(func, col)

search where are suitable for some limit ,

and sort according numerical col.

column有什么能处理的呢?处理下位概念value?

用value的值构建新的column

数据出图,图是二维的,意思就是2个数构成一个点

意思就是永远关注 一个点 是由哪两个数构成的,涉及数和数之间的关系

所有的关系只有两种:绝对 和 相对

关系图有hist, plot, scatter , barh(目前)

- 绝对:plot,barh

- 相对:hist,scatter

思考问题,要看用什么关系,那就用什么图

数绝对,比例相对,hist就是面积是比例

图就是两个数列之间的对应关系

  • 9
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值