php 分割中文标点语句,并保留标点符号!
$arr = preg_split("/(\n|,|。|!|?|;)/", $section,-1, PREG_SPLIT_DELIM_CAPTURE | PREG_SPLIT_NO_EMPTY);
关于正则替换中文乱码,用== mb_ereg_replace==:
mb_regex_encoding('utf-8');//设置正则替换所用到的编码
$a = '2013年06月06';
$a = mb_ereg_replace('[^0-9]', '-', $a);//注意这里的和preg_replace不一样 它无需用正则的/xxxxx/这种限定符 直接写主体即可
echo $a;
通过个,要好好认识一下,pre_split这个方法了。
pre_split方法具体参数:
preg_split ( string $pattern , string $subject [, int $limit = -1 [, int $flags = 0 ]] ) : array
pattern
用于搜索的模式,字符串形式。
subject
输入字符串
limit
如果指定,将限制分隔得到的子串最多只有limit个,返回的最后一个 子串将包含所有剩余部分。limit值为-1, 0或null时都代表"不限制", 作为php的标准,你可以使用null跳过对flags的设置。
flags
flags 可以是任何下面标记的组合(以位或运算 | 组合):
PREG_SPLIT_NO_EMPTY
如果这个标记被设置, preg_split() 将仅返回分隔后的非空部分。
PREG_SPLIT_DELIM_CAPTURE
如果这个标记设置了,用于分隔的模式中的括号表达式将被捕获并返回。
PREG_SPLIT_OFFSET_CAPTURE
如果这个标记被设置, 对于每一个出现的匹配返回时将会附加字符串偏移量. 注意:这将会改变返回数组中的每一个元素, 使其每个元素成为一个由第0 个元素为分隔后的子串,第1个元素为该子串在subject 中的偏移量组成的数组。