获取字符串长度与字符串个数 utf8 gb2312

//先定义2个函数
//判断如果不是UTF-8格式编码,则转换成UTF-8格式
function charset($data){
    if( !empty($data) ){
      $fileType = mb_detect_encoding($data , array('UTF-8','GBK','LATIN1','BIG5')) ;
      if( $fileType != 'UTF-8'){
        $data = mb_convert_encoding($data ,'utf-8' , $fileType);
      }
    }
    return $data;
  }
// 计算中文字符串长度(utf-8)
function getnum($str) {
	preg_match_all("/[0-9]{1}/",$str,$arrNum);
	preg_match_all("/[a-zA-Z]{1}/",$str,$arrAl);
	preg_match_all("/([\x{4e00}-\x{9fa5}]){1}/u",$str,$arrCh);

	$num1 = count($arrNum[0]); //数字个数
	$num2 = count($arrAl[0]); //字母个数
	$num3 = count($arrCh[0]); //中文个数
	$sum = $num1 + $num2 + $num3;
	return $sum;
}

//比较:
//UTF-8
$str = '我是中国人111aaa';
$strlen = strlen($str);
$num = getnum($str);
echo $strlen . ',' . $num;
//结果: 21,11 ,utf8编码strlen获取到的是字节大小

//GB2312
$str = '我是中国人111aaa';
$strlen = strlen($str);
$num = getnum($str);
echo $strlen . ',' . $num;
//结果: 16,6 ,gb2312编码strlen获取到的是字节数,getnum函数只能计算UTF8的中文字段长度,所以是得出0,结果为6,可以通过charset函数更改字符串编码
//或者用iconv(in_charset, out_charset, str)更改编码再去根据自己需求计算


  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值