最近在检测字符是否为数字的时候用到了Char.IsDigit(),测试的时候误操作输入了全角字符,以致在做类型转换的时候报了个大大的异常。我忽如其来的好奇心想知道是什么原因?!!!
于是我十指大动用度娘解开了Char.IsDigit()的“神秘面纱”。
判断Char是否为数字有三种方法:
- Char.IsDigit (aChar) 指示指定字符串中位于指定位置处的字符是否属于十进制数字类别
- Char.IsNumber(aChar) 指示指定字符串中位于指定位置的字符是否属于数字类别
- aChar>='0'&&aChar<='9' 判断aChar是否位于‘0’到‘9’之前 等同于第一种
为了更好的学习,我们查看源码可以看到
public static bool IsNumber(char c)
{
if (!IsLatin1(c))
{
return CheckNumber(CharUnicodeInfo.GetUnicodeCategory(c));
}
if (!IsAscii(c))
{
return CheckNumber(GetLatin1UnicodeCategory(c));
}
return ((c >= '0') && (c <= '9'));
}
public static bool IsDigit(char c)
{
if (!IsLatin1(c))
{
return (CharUnicodeInfo.GetUnicodeCategory(c) == UnicodeCategory.DecimalDigitNumber);
}
return ((c >= '0') && (c <= '9'));
}
可以看出IsDigit和IsNumber之间有什么区别呢?
从表面上看Char.IsNumber 多了一步检查ASCII码
那可能有好奇心重的小伙伴就要想了:
- IsLatin1()这个方法是干什么的呢?
- IsNumber里的CheckNumber()具体是干什么?
下面我们一个一个来说
- IsLatin1方法是判断字符是0~255的函数,值得注意的是:全角的0、1、2、3、4、5等的Unicode编码不在这个范围
- CheckNumber方法看一下源码就明白了
internal static bool CheckNumber(UnicodeCategory uc)
{
switch (uc)
{
case UnicodeCategory.DecimalDigitNumber:
case UnicodeCategory.LetterNumber:
case UnicodeCategory.OtherNumber:
return true;
}
return false;
}
这就能看出IsNumber和IsDigit方法相比有3点区别:
1)多了一个UnicodeCategory.LetterNumber类型
2)多了一个UnicodeCategory.OtherNumber类型
3)多了一个IsAscii的判断(0~127)
显然IsNumber的适用范围更大。
下面列举几种IsNumber认为是数字的字符
UnicodeCategory.LetterNumber:Ⅰ、Ⅱ、Ⅲ
UnicodeCategory.OtherNumber:①、②、③
IsDigit方法在判断全角数字时,因为全角的0、1、2、3等的Unicode编码不在字符是0~255的范围,于是就执行了下面这句代码:
CharUnicodeInfo.GetUnicodeCategory(c) == UnicodeCategory.DecimalDigitNumber;
对于Unicode的分类中,半角的1,2,3和全角的0、1、2、3等都被归为了DecimalDigitNumber,所以对于全角的数字,这个方法返回了true。
结论
有了上面的了解,我们在判断字符是否是数字的时候就需要注意了。
在判断是否是ASCII数字(0~9)的时候,我们需要注意以下几点了。
1)不能用IsDigit和IsNumber函数判断是否是ASCII数字,这两个函数都有可能把ASCII以外的某些字符当做是数字。
2)尽量用这种方式判断: c >= '0' && c <= '9'(当然也可以用正则表达式)。
3)数字判断的严格性,从严到松依次是:
c >= '0' && c <= '9' ⇒IsDigit ⇒IsNumber
小伙伴们,你们会判断字符是否是数字了吗?