php 逐个字符,中文分词 - php逐个汉字遍历字符串

巴扎黑2017-04-10 14:53:061楼

//UTF8算法,其它编码自行转换

$cind = 0;

$arr_cont = array();

for ($i = 0; $i < strlen($tempaddtext); $i++) {

if (strlen(substr($tempaddtext, $cind, 1)) > 0) {

if (ord(substr($tempaddtext, $cind, 1)) < 192) { //如果为英文则取1个字节

if (substr($tempaddtext, $cind, 1) != " ") {

array_push($arr_cont, substr($tempaddtext, $cind, 1));

}

$cind++;

} elseif(ord(substr($tempaddtext, $cind, 1)) < 224) {

array_push($arr_cont, substr($tempaddtext, $cind, 2));

$cind+=2;

} else {

array_push($arr_cont, substr($tempaddtext, $cind, 3));

$cind+=3;

}

}

}

print_r($arr_cont);

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值