网页关键词频率计算(词频计算js版)

这是一个使用JavaScript实现的网页关键词频率计算方法,无需词库,通过分割网页内容提取并统计中英文词语出现次数,按从多到少排序。代码中包括字符串处理和字典对象的使用,以及对匹配次数的排序处理。
摘要由CSDN通过智能技术生成
不需要词库,直接分割网页内容提取词语.并且计算词语出现次数按照从多到少排序, 这里能区分中英文词语

//石卓林 2008-7-12 第二版.左右右左匹配版
function keywords(ftitle,ftbody){
	this.trim = function(text){return text.replace(/(^\s*)|(\s*$)/g,'');}
	this.title = ftitle;
	this.tbody = ftbody.replace(/(\s+)/g,' ');//.substr(40,400);//截取最可能的内容此处数字需改进
	this.tbody = this.trim(this.tbody);
	this.tbodylen = this.tbody.length;
	this.chardic = new ActiveXObject('Scripting.Dictionary');	
	this.tempasc = 0;
	this.tempchar = '';
	this.tempcharat='';
	this.endchar = '。,:… (—)》《';
	this.chscount = 0;
	this.keys = new Array();
	var oldchar='',oldcount=0;
	for(var i=0;i<this.tbodylen;i++){
		this.chscount = 0;
		for(var j=1;j<=15;j++){//最长英文单词15
			this.tempchar = this.tbody.substr(i,j);
			this.tempasc = this.tempchar.charCodeAt(j-
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值