shell实现类矩阵格式数据统计及输出(hive环境下数据的过程化处理)

源数据:

数据为7天内每个用户有过打电话行为的天数、总的呼叫次数及日均呼叫次数

 

目标数据:

将数据转换成如下格式->日均呼叫次数为x,呼叫天数为y的人数

行标数字->日均呼叫次数x

列标数字->呼叫天数y

需要得到的数值->上述两者的交集

 

 

分析思路:

外层循环->行控制

内存循环->列控制

数组赋值->在内循环中接收awk统计的交叉点sum

 

具体实现:

#!/bin/bash

 

#file

filen=test.txt   #源数据文件

filer=test.csv   #目标数据文件

 

 

sed -i 's/\.0//g' ${

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值