统计词性语料库

open(In,"corpus.txt");
open(out,">cibiao.txt");
while(<In>){
	chomp;
	@Words=$_=~/(\S+)\/\S+/g;
	@POSs=$_=~/\S+\/(\S+)/g;
	for($i=0;$i<@Words;$i++){
		# if(defined $hash{$Word[$i]}){
		# $refPOS=$hash{$Word[$i]};
		# ${$refPOS}{$POSs[$i]}=1;
  # } 
	# else{
		# my %posHash=($POSs[$i],1);
		# $hash{$Words[$i]}=\%posHash;
  # }
	${$hash{$Words[$i]}}{$POSs[$i]}=1;
	}
}
close(In);
foreach $word(sort keys %hash){
	print "$word\t";
	print out "$word\t";
	$pPOS=$hash{$word};
	foreach $pos(sort keys %{$pPOS}){
    print "$pos;";
	print out "$pos;";
   }
	print "\n";
	print out "\n";
}
close(out); 


  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值