统计文段中英语单词数量

网上找到的方案

function wordCalculate(words) {
    if (words) {
        // 1.复制副本
        let value = words
        // 2.将中文字符替换为空格
        value = value.replace(/[\u4e00-\u9fa5]+/g, " ");
        // 3.将数值字符替换为空格
        value = value.replace(/[0-9]+/g, " ");
        // 4.将换行符,前后空格去除
        value = value.replace(/\n|\r|^\s+|\s+$/gi, "");
        // 5.将多个空格替换成一个空格
        value = value.replace(/\s+/gi, " ");
        // 6.计数统计
        var length = 0;
        var match = value.match(/\s/g);
        if (match) {
            length = match.length + 1;
        } else if (value) {
            length = 1;
        }
        return length
    }
}

上述方案里,原方案中没有第 3 步的将数字替换掉的操作,会导致结果将数字也作为一个单词来做计算。所以,我自己加上了第 3 步,做了一个数字的清除操作。

这个方案里,可以看到,最后是通过计算空格空开的数量来计算单词的数量的。并且,实际上在方案中还存在着一个问题,那就是没有做除了汉字、数字、空格以外的其他字符的清除操作,这也会导致最终的计算结果并不准确。

我自己的方案

function wordCalculateOwn(words) {
    if (words) {
        // 1.复制副本
        let value = words
        // 2.将字符串切分成单个字符
        const chars = value.split('')
        // 3.将所有非字母的字符替换为空格
        chars.forEach((char, i) => {
            if (!char.match(/[a-zA-Z]/)) {
                chars[i] = ' '
            }
        })
        // 4.重新组装成新的字符串
        value = chars.join('')
        // 5.将新的字符串按空格切分并过滤掉多余空格
        value = value.split(' ').filter(i => i && i !== ' ')
        // 6.返回单词数量
        return value.length
    }
}

这个,是我自己的方案,用到字符串的切分和数组转字符串的操作。

在这个方案中实际上也是存在一些问题的,比如,如果出现了带有连词符的单词,比如:co-operation,就可能被判定为两个单词。当然,要避免这种情况也是可以的(但我就是不写)。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值