在小程序js开发环境中,获取文章中的中文词频

准备:中文一堆

操作:复制中文,点运行,出来结果复制到excel中

如下是分析 新的党章 的结果,发展是第一位有效的,后面是社会主义

党的271
委员223
委员会187
组织151
主义150
社会126
中国118
党员116
发展113
会主98
会主义98
社会主98
社会主义98
领导85
中央83
坚持80
纪律79
工作74

设计思路有点忘记了,结果应该没问题

getwordlist_ch(){//测试任何文章词汇,获取中文清单,包括词频
  let isonly=false//单个字不查,单个字基本上没啥意思
  let app=this
  let copyStr=app.data.copyArr[0]//获取剪贴板数据
  let inarr=copyStr.split("\r\n")
  app.data.outArr=[];
  let outstr=''
  let str=''
  let arrword=[]
  let arrlist=[]
  let jsarr={}
  let maxlongth=10//最多10个字,可以设置成20个,没啥意义
  for(let m=0;m<inarr.length;m++)
  {
  str=inarr[m];
  for(let i=0;i<str.length;i++)
  {
  if(app.ischn(str.charAt(i)))
  {
  if(isonly) {arrword.push(str.charAt(i));}
    for(let j=1;j<maxlongth;j++){
    if(app.ischn(str.charAt(i+j)))
    arrword.push(str.slice(i,i+j+1));
    else{break;}
    }
    for(let t=0;t<arrword.length;t++){
      if(arrlist.indexOf(arrword[t])==-1)
      {
        arrlist.push(arrword[t]);
        jsarr[arrword[t]]=1;
      }
      else
      {
        jsarr[arrword[t]]=jsarr[arrword[t]]+1;
      }
      }
      arrword=[];
  }
  }
  }
  outstr='';
  for (var key in jsarr )
  {
    outstr=outstr+key+'\t'+jsarr[key]+'\r\n'
  }

  app.data.outArr[0]=outstr;
 
    app.data.outStr=outstr;//把数据传递出去剪贴板数据
  app.setData({
  result:'ok' 
  });
  wx.setClipboardData({
  data:app.data.outStr,
  success: function(res) {
  
  },
  fail: function(res) {
  }
  });  
  
  },
ischn(str){
    var reg=/^[\u4E00-\u9FA5]+$/;
    if (!reg.test(str)){
        return false ;
    }else{
        return true ;
    }
},

不在小程序中,估计可以在其他地方,把输出改改这里有个复制到粘贴板的操作,其他看起来没啥依赖

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值