题目链接:
题目描述:
请实现一个函数用来判断字符串是否表示数值(包括整数和小数)。
数值(按顺序)可以分成以下几个部分:
- 若干空格
- 一个 小数 或者 整数
- (可选)一个
'e'
或'E'
,后面跟着一个 整数 - 若干空格
小数(按顺序)可以分成以下几个部分:
- (可选)一个符号字符(
'+'
或'-'
) - 下述格式之一:
- 至少一位数字,后面跟着一个点
'.'
- 至少一位数字,后面跟着一个点
'.'
,后面再跟着至少一位数字 - 一个点
'.'
,后面跟着至少一位数字
- 至少一位数字,后面跟着一个点
整数(按顺序)可以分成以下几个部分:
- (可选)一个符号字符(‘+’ 或 ‘-’)
- 至少一位数字
部分数值列举如下:
["+100", "5e2", "-123", "3.1416", "-1E-16", "0123"]
部分非数值列举如下:
["12e", "1a3.14", "1.2.3", "+-5", "12e+5.4"]
提示:
1 <= s.length <= 20
s
仅含英文字母(大写和小写),数字(0-9
),加号'+'
,减号'-'
,空格' '
或者点'.'
。
思路
这题直接无脑做肯定是很痛苦的,显然这是一个学习正则表达式的机会,然后我就研究了下这个东西。
然后发现学习的过程比暴力做这题还痛苦
只想学正则表达式的同学可以快进到文末的参考资料,别人总结的很详细。
最后写的代码是这样的:
//#include<regex> //编译错误就加上
class Solution {
public:
bool isNumber(string s) {
regex r(" *[+-]?(\\d+\\.?|\\.\\d)\\d*([eE][+-]?\\d+)? *");
return regex_match(s,r);
}
};
这个代码在牛客上是可以轻松 AC 的,但是在 leetcode 只能勉强通过。这也是比较离谱的,毕竟 s.size()
才 20,居然跑了 2000ms 。
如果你在 leetcode 上交了我的代码,并且发现超时了,那么建议多交几次试试,他有一定概率能通过。
![](https://i-blog.csdnimg.cn/blog_migrate/4379362a1c48bd9696d9283bf7b60efa.png)
提交详情:https://leetcode.cn/submissions/detail/314750644/
之后惊奇地发现,同样的正则表达式,用 Java 4ms 就 AC 了。
显然 C++ STL 中的正则表达式在效率上是不太行的。
之后我又查阅了些资料,看看有没有提高效率的方法。发现吐槽 STL 中 regex 效率的文章还挺多,甚至有人说:
当遇到一个文本处理问题时,如果你在第一时间想到了正则表达式,那么恭喜你,你的问题从一个变成了俩!
最终,找到两个提高性能的方法:
- 用
boost::regex
- 在
std::regex
中避免使用string
比较遗憾的是,不管是牛客还是 leetcode,都不支持 <boost/regex.hpp>
这个头文件。
那只能用试试第二个方法了,但是效果也不明显。
另外这道题也可以自己写一个有限状态机来做,这个代码跑起来超级快,O(n) 复杂度。
参考资料: