区分中英文字符的两种方法: 正则和charCodeAt()方法

最近在为项目写登录注册系列页面, 表单验证无疑是不可缺少的部分, 在这个jQ插件满天飞的web年代, 表单验证倒也不是难事. 但再好的插件, 也并不能做到十全十美, 比如这次用到的我先前介绍过的Vanadium表单验证插件, 因为是E文中不存在占2个字符的字, 所以, 区分中英文字符就得自己扩展. 本文就将介绍两种区分中英文字符的方法: 利用正则和charCodeAt方法区分中英文字符.点此查看DEMO
正则无疑是最强大的判断各种条件的方法, 最近也在研习它, 虽然枯燥, 但仍有乐趣. 用它来判断一个双字节的中文字符也是轻而易举地. 而判断中文字符, Mr.Think也是非常推荐用这种方法的, 简单且执行效率高.
核心代码如下:

regExpForm . onblur = function (){
        
entryVal = this . value ;
        
entryLen = entryVal . length ;
        
cnChar = entryVal . match ( / [^\x00-\x80] /g ) ; //利用match方法检索出中文字符并返回一个存放中文的数组
        
entryLen += cnChar . length ; //算出实际的字符长度
    
}

第二种方法是通过charCodeAt()方法判断Unicode码值, 若大于255即为中文字符(为什么? 请Google ). Mr.Think并不建议用这种方法的, 它的执行效率没有正则高, 也没有正则简单.
核心代码如下:

entryVal = this . value ;
        
entryLen = entryVal . length ;
        
for ( var i = 0 ; i < entryVal . length ; i ++ ){
            
if ( entryVal . charCodeAt ( i ) > 255 ){ //遍历判断字符串中每个字符的Unicode码,大于255则为中文
                
cnArr . push ( entryVal [ i ]) ; //讲符合条件的值插入到中文字符数组中
                
//注意一个小bug,push是向数组的末尾添加一个或多个元素并返回新的长度,所以未刷新的情况下反复blur会累加字符值
            
}
        
}
        
entryLen += cnArr . length ;

原文发布于Mr.Think的博客:
http://mrthink.net/js-cn-en-character/ ,转载请注明出处.

转载于:https://www.cnblogs.com/mrthink/archive/2010/10/26/1861673.html

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值