题目描述
请实现一个函数用来判断字符串是否表示数值(包括整数和小数)。
数值(按顺序)可以分成以下几个部分:
- 若干空格
- 一个 小数 或者 整数
- (可选)一个 ‘e’ 或 ‘E’ ,后面跟着一个 整数
- 若干空格
小数(按顺序)可以分成一下几个部分:
- (可选)一个符号字符(’+’ 或 ‘-’)
- 下述格式之一:
- 至少一位数字,后面跟着一个点 ‘.’
- 至少一位数字,后面跟着一个点 ‘.’ ,后面再跟着至少一位数字
- 一个点 ‘.’ ,后面跟着至少一位数字
整数(按顺序)可以分成以下几个部分:
- (可选)一个符号字符(’+’ 或 ‘-’)
- 至少一位数字
部分数值列举如下:
- ["+100", “5e2”, “-123”, “3.1416”, “-1E-16”, “0123”]
部分非数值列举如下:
- [“12e”, “1a3.14”, “1.2.3”, “±5”, “12e+5.4”]
解法:有限状态自动机
本题使用有限状态自动机。根据字符类型和合法数值的特点,先定义状态,再画出状态转移图,最后编写代码即可。
字符类型:
空格 「 」、数字「
0
—
9
0—9
0—9 」 、正负号 「
+
−
+−
+− 」 、小数点 「 … 」 、幂符号 「
e
E
eE
eE 」 。
状态定义:
按照字符串从左到右的顺序,定义以下 9 种状态。
- 开始的空格
- 幂符号前的正负号
- 小数点前的数字
- 小数点、小数点后的数字
- 当小数点前为空格时,小数点、小数点后的数字
- 幂符号
- 幂符号后的正负号
- 幂符号后的数字
- 结尾的空格
结束状态:
合法的结束状态有 2, 3, 7, 8 。
算法流程:
- 初始化:
- 状态转移表 s t a t e s states states : 设 s t a t e s [ i ] states[i] states[i] ,其中 i i i 为所处状态, s t a t e s [ i ] states[i] states[i] 使用哈希表存储可转移至的状态。键值对 ( k e y , v a l u e ) (key, value) (key,value) 含义:若输入 k e y key key ,则可从状态 i i i 转移至状态 v a l u e value value 。
- 当前状态 p p p : 起始状态初始化为 p = 0 p = 0 p=0 。
- 状态转移循环: 遍历字符串
s
s
s 的每个字符
c
c
c 。
- 记录字符类型
t
t
t : 分为四种情况。
- 当 c c c 为正负号时,执行 t = ‘s’ ;
- 当 c c c 为数字时,执行 t = ‘d’ ;
- 当 c c c 为 e , E 时,执行 t = ‘e’ ;
- 当 c c c 为 . , 空格 时,执行 t = c (即用字符本身表示字符类型);
- 否则,执行 t = ‘?’ ,代表为不属于判断范围的非法字符,后续直接返回 f a l s e false false 。
- 终止条件: 若字符类型 t t t 不在哈希表 s t a t e s [ p ] states[p] states[p] 中,说明无法转移至下一状态,因此直接返回 F a l s e False False 。
- 状态转移: 状态 p p p 转移至 s t a t e s [ p ] [ t ] states[p][t] states[p][t] 。
- 记录字符类型
t
t
t : 分为四种情况。
- 返回值: 跳出循环后,若状态 p ∈ 2 , 3 , 7 , 8 p \in {2, 3, 7, 8} p∈2,3,7,8 ,说明结尾合法,返回 T r u e True True ,否则返回 F a l s e False False 。
复杂度分析:
- 时间复杂度 O ( N ) O(N) O(N) : 其中 NN 为字符串 s s s 的长度,判断需遍历字符串,每轮状态转移的使用 O ( 1 ) O(1) O(1) 时间。
- 空间复杂度 O ( 1 ) O(1) O(1) : s t a t e s states states 和 p p p 使用常数大小的额外空间。
C++代码实现
class Solution {
public:
// 方法一:有限状态自动机DFA,时间复杂度 O(N)
typedef pair<char,int> charint;
typedef unordered_map<char,int> unmap;
bool isNumber(string s) {
vector<unmap> states = {
unmap{charint(' ',0),charint('s',1),charint('d',2),charint('.',4)},
unmap{charint('d',2),charint('.',4)},
unmap{charint('d',2),charint('.',3),charint('e',5),charint(' ',8)},
unmap{charint('d',3),charint('e',5),charint(' ',8)},
unmap{charint('d',3)},
unmap{charint('s',6),charint('d',7)},
unmap{charint('d',7)},
unmap{charint('d',7),charint(' ',8)},
unmap{charint(' ',8)}
};
int p = 0;
char t;
for(char c:s){
if(c >= '0' && c <= '9')
t = 'd';
else if(c == '+' || c == '-')
t = 's';
else if(c == 'e' || c == 'E')
t = 'e';
else if(c == '.' || c == ' ')
t = c;
else
t = '?';
if(!states[p].count(t))
return false;
p = (int) states[p][t];
}
return p == 2 || p == 3 || p == 7 || p == 8;
}
};