请你来实现一个 myAtoi(string s)
函数,使其能将字符串转换成一个 32 位有符号整数。
函数 myAtoi(string s)
的算法如下:
- 空格:读入字符串并丢弃无用的前导空格(
" "
) - 符号:检查下一个字符(假设还未到字符末尾)为
'-'
还是'+'
。如果两者都不存在,则假定结果为正。 - 转换:通过跳过前置零来读取该整数,直到遇到非数字字符或到达字符串的结尾。如果没有读取数字,则结果为0。
- 舍入:如果整数数超过 32 位有符号整数范围
[−231, 231 − 1]
,需要截断这个整数,使其保持在这个范围内。具体来说,小于−231
的整数应该被舍入为−231
,大于231 − 1
的整数应该被舍入为231 − 1
。
返回整数作为最终结果。
示例 1:
输入:s = "42"
输出:42
解释:加粗的字符串为已经读入的字符,插入符号是当前读取的字符。
带下划线线的字符是所读的内容,插入符号是当前读入位置。 第 1 步:"42"(当前没有读入字符,因为没有前导空格) ^ 第 2 步:"42"(当前没有读入字符,因为这里不存在 '-' 或者 '+') ^ 第 3 步:"42"(读入 "42") ^
示例 2:
输入:s = " -042"
输出:-42
解释:
第 1 步:" -042"(读入前导空格,但忽视掉) ^ 第 2 步:" -042"(读入 '-' 字符,所以结果应该是负数) ^ 第 3 步:" -042"(读入 "042",在结果中忽略前导零) ^
示例 3:
输入:s = "1337c0d3"
输出:1337
解释:
第 1 步:"1337c0d3"(当前没有读入字符,因为没有前导空格) ^ 第 2 步:"1337c0d3"(当前没有读入字符,因为这里不存在 '-' 或者 '+') ^ 第 3 步:"1337c0d3"(读入 "1337";由于下一个字符不是一个数字,所以读入停止) ^
示例 4:
输入:s = "0-1"
输出:0
解释:
第 1 步:"0-1" (当前没有读入字符,因为没有前导空格) ^ 第 2 步:"0-1" (当前没有读入字符,因为这里不存在 '-' 或者 '+') ^ 第 3 步:"0-1" (读入 "0";由于下一个字符不是一个数字,所以读入停止) ^
示例 5:
输入:s = "words and 987"
输出:0
解释:
读取在第一个非数字字符“w”处停止。
提示:
0 <= s.length <= 200
s
由英文字母(大写和小写)、数字(0-9
)、' '
、'+'
、'-'
和'.'
组成
步骤1:问题分析
本题目要求实现一个将字符串转换为32位有符号整数的函数 myAtoi
。这类问题的本质是从字符串中提取数字并处理边界情况,如空格、符号以及数值范围。问题的关键点在于:
-
输入:
- 一个由空格、字母、数字、
+
、-
和其他字符组成的字符串。 - 输入长度为
0 <= s.length <= 200
。
- 一个由空格、字母、数字、
-
输出:
- 返回一个整数,数值范围必须限制在32位有符号整数范围内,即
[-2^31, 2^31 - 1]
。
- 返回一个整数,数值范围必须限制在32位有符号整数范围内,即
-
限制:
- 需要处理前导空格。
- 检查数字前面的正负号。
- 遇到非数字字符立即停止读取数字。
- 若读取的数字超过32位有符号整数范围,需要将其截断为
-2^31
或2^31 - 1
。
-
边界条件:
- 空字符串处理。
- 仅包含空格的字符串。
- 字符串中包含其他无效字符时应立即停止并返回当前已读取的数字。
- 字符串包含前导零的情况需要处理。
步骤2:解题思路分析
步骤划分:
-
跳过前导空格:
- 我们需要遍历字符串,忽略前导的空格字符,直到找到第一个非空字符。
-
判断正负号:
- 如果遇到字符
'-'
或'+'
,需要记录下当前数字的符号,默认为正数。
- 如果遇到字符
-
数字读取:
- 从第一个有效数字开始读取,直到遇到非数字字符或到达字符串的末尾。
- 在读取过程中,如果读取的数字超过32位有符号整数范围,需要进行截断处理。
-
范围截断:
- 判断当前结果是否超过
INT_MAX (2^31 - 1)
或INT_MIN (-2^31)
,根据需要进行截断。
- 判断当前结果是否超过
算法设计:
可以采用 逐字符遍历 的方法。对于每个字符,根据其内容进行相应处理。整个过程时间复杂度为 O(n),其中 n
为字符串的长度。由于只需常量额外空间存储当前数字和符号,空间复杂度为 O(1)。
步骤4:算法优化与启发
通过这个问题,我们可以获得以下启发:
-
逐字符解析与状态管理:
- 当处理字符串解析问题时,常常需要根据上下文条件(如符号、前导零等)逐字符解析。
- 边界条件检查非常重要,尤其是对于数值问题。我们通过检查是否超出32位整数的边界,避免了溢出错误。
-
空间与时间的权衡:
- 该算法的时间复杂度为
O(n)
,非常适合处理长度较短的输入。且由于每次只操作单个字符,没有额外的空间开销,空间复杂度为O(1)
。 - 在大规模数据集处理时,确保算法的线性时间复杂度是保证效率的关键。
- 该算法的时间复杂度为
步骤5:实际应用场景
此类字符串解析问题在很多实际场景中都有应用,尤其是在处理用户输入、文本日志解析或传感器数据时。
实际应用示例:金融数据解析
在金融领域,常常需要从文本格式的文件(如 CSV 或 JSON)中提取数值信息。例如:
- 解析股票交易日志时,用户输入的价格可能包含多余的字符、空格甚至不合法的符号。
- 利用类似
myAtoi
的函数,我们可以将这些价格字符串转换为标准的数字格式,并进行有效的金融分析与预测。
具体实现:
- 读取交易数据文件,并将每行数据解析为字符串。
- 使用改进版
myAtoi
函数提取价格等数值信息。 - 对提取的数据进行金融模型分析(如预测股票走势、计算均值等)。
通过高效的字符串解析算法,可以大幅提升金融数据处理的精度与速度。