调试经验——Spotfire分箱数据分析方法(Binned Column)

数据分析中,经常要用到频度分析。在Spotfire中,可通过插入Binned Column方式自定义频度,快速、便捷的进行频度分析。

比如,通过原始数据统计出的词频表如下所示:

由于各词类的词条数相差很大(最少1条,最多几千条),放在同一张图上基本没法看。

虽然可以使用Show/Hide Items来仅显示一部分数据(如Top 40),如下图所示,但毕竟,不能反映数据全貌。



要显示全貌,频度统计是个不错的方法。

那么,如何在Spotfire数据集中生成频度数据呢?

方法如下:

1. Insert-> Binned Column(分箱方法有好几种,试了一下,我还是比较喜欢第一种,即直接指定边界值的方法)


2. 插入分箱列完成后,可在图表中选择该列,查看效果。


3. 如果要更改分箱方法或修改分箱参数(如边界值),可在Edit -> Column Properties中进行修改。


附记:

What is Binning?

----------------------------------------------------------------------------------------------------------------------------------------------

Binning is a way to group a number of more or less continuous values into a smaller number of "bins". For example, if you have data about a group of people, you might want to arrange their ages into a smaller number of age intervals. Numeric columns can also be temporarily grouped by right-clicking on a column selector and clicking Auto-bin Column.

There is also an option to group categorical values into bins. This is useful when you have more categorical values in a column than you find necessary. Your visualization may for example show sales of apples, pears, oranges and limes, but you are interested in citrus fruit sales compared to apples and pears sales. Then oranges and limes can be grouped into a bin.


  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值