Label 的分布统计

1、

文本形式:

Label \t  XXXXXXX

            a. 通过 awk 进行分隔,获得Label

awk -F '\t' '{print $1;}' corpus.txt >> awk_log.txt

            b. 编写    ak.awk

#!/bin/awk -f
# 开始
BEGIN{
}
# 运行中
{
    for(i=1;i<=NF;i++){
        wordName[$i]=$i;
        wordCount[$i]++;
    }

}
# 结束
END{

    for(j in wordName) {
        print j"\t"wordCount[j];
    }
}

            c.编写 akBash.sh

#!/bin/bash
file=$1
awk -f ak.awk $file

         d.执行  sh akBash.sh awk_log.txt

10      11219
11      11253
12      7454
20      3739
13      2056
21      2540
14      5152
22      8607
15      3740
23      6661
16      9245
30      1261
31      6683
17      6654
24      907
18      11159
32      3816
25      7453
26      2656
33      7488
19      1595
40      3720
27      7486
34      10416
41      6963
35      11174
42      7492
28      7492
36      7386
43      11116
29      5084
37      7493
44      7492
38      7501
39      3749
0       9394
1       11251
2       11234
3       11246
4       5782
5       6432
6       13645
7       11118
8       321
9       9026





  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值