要检测一个上传的csv文件是否含有全角字符。含有这阻止上传。
在网上去搜索对应的全角字符的正则表达式。
结果上传的文件的编码不同,正则表达式的效果也不尽人意。
逆向考虑,只允许合法字符(半角英数字字符)的时候,才允许上传。
正则表达式:
<?php
// http://www.asciitable.com/
// \x20-\x7E : 表示可能のASCII文字
// \xA: newline \xD:return
if (preg_match('/^[\x20-\x7E\xA\xD]+$/', $content)) {
// 上传操作
}
?>
顺便复习下PHP中和正则表达式相关的函数。
preg_match() 函数用于进行正则表达式匹配,成功返回 1 ,否则返回 0 。
语法:
int preg_match( string pattern, string subject [, array matches ] )
参数说明:
- pattern: 正则表达式
- subject: 需要匹配检索的对象
- matches: 可选,存储匹配结果的数组, matches[0]将包含与整个模式匹配的文本, matches[1] 将包含与第一个捕获的括号中的子模式所匹配的文本,以此类推
preg_match() 第一次匹配成功后就会停止匹配,如果要实现全部结果的匹配,即搜索到subject结尾处,则需使用 preg_match_all() 函数。
preg_match_all() 函数用于进行正则表达式全局匹配,成功返回整个模式匹配的次数(可能为零),如果出错返回 FALSE 。
语法:
int preg_match_all( string pattern, string subject, array matches [, int flags ] )
参数说明:
- pattern 正则表达式
- subject 需要匹配检索的对象
- matches 存储匹配结果的数组
- flags 可选,指定匹配结果放入 matches 中的顺序,可供选择的标记有:
- PREG_PATTERN_ORDER:默认,对结果排序使 matches[0]为全部模式匹配的数组, matches[1] 为第一个括号中的子模式所匹配的字符串组成的数组,以此类推
- PREG_SET_ORDER:对结果排序使 matches[0]为第一组匹配项的数组, matches[1] 为第二组匹配项的数组,以此类推
- PREG_OFFSET_CAPTURE:如果设定本标记,对每个出现的匹配结果也同时返回其附属的字符串偏移量
preg_replace() 函数用于正则表达式的搜索和替换。
语法:
mixed preg_replace( mixed pattern, mixed replacement, mixed subject [, int limit ] )
参数说明:
- pattern 正则表达式
- replacement 替换的内容
- subject 需要匹配替换的对象
- limit 可选,指定替换的个数,如果省略 limit 或者其值为 -1,则所有的匹配项都会被替换
* preg_ split()* 函数用于正则表达式分割字符串。
语法:
array preg_split( string pattern, string subject [, int limit [, int flags]] )
参数说明:
- pattern 正则表达式
- subject 需要匹配分割的对象
- limit 可选,如果指定了 limit ,则最多返回 limit 个子串,如果 limit 是 -1,则意味着没有限制,可以用来继续指定可选参数 flags
- flags 设定 limit 为 -1 后可选,可以是下列标记的任意组合(用按位或运算符 | 组合):
- PREG_SPLIT_NO_EMPTY:preg_split() 只返回非空的成分
- PREG_SPLIT_DELIM_CAPTURE:定界符模式中的括号表达式也会被捕获并返回
- PREG_SPLIT_OFFSET_CAPTURE:对每个出现的匹配结果也同时返回其附属的字符串偏移量。注意这改变了返回的数组的值,使其中的每个单元也是一个数组,其中第一项为匹配字符串,第二项为其在 subject 中的偏移量。
参考:
ASCII : http://www.asciitable.com/
preg_match 与 preg_match_all 函数 : http://www.5idev.com/p-php_preg_match.shtml
PHP 常用正则表达式整理 : http://www.5idev.com/p-php_regular_expressions.shtml