8 字符串转换整数 (atoi)(模拟、有限状态机)

1. 问题描述:

请你来实现一个 atoi 函数,使其能将字符串转换成整数。

首先,该函数会根据需要丢弃无用的开头空格字符,直到寻找到第一个非空格的字符为止。接下来的转化规则如下:

如果第一个非空字符为正或者负号时,则将该符号与之后面尽可能多的连续数字字符组合起来,形成一个有符号整数。
假如第一个非空字符是数字,则直接将其与之后连续的数字字符组合起来,形成一个整数。
该字符串在有效的整数部分之后也可能会存在多余的字符,那么这些字符可以被忽略,它们对函数不应该造成影响。
注意:假如该字符串中的第一个非空格字符不是一个有效整数字符、字符串为空或字符串仅包含空白字符时,则你的函数不需要进行转换,即无法进行有效转换。

在任何情况下,若函数不能进行有效的转换时,请返回 0 。

提示:

本题中的空白字符只包括空格字符 ' ' 。
假设我们的环境只能存储 32 位大小的有符号整数,那么其数值范围为 [−231,  231 − 1]。如果数值超过这个范围,请返回  INT_MAX (231 − 1) 或 INT_MIN (−231) 。

示例 1:

输入: "42"
输出: 42
示例 2:

输入: "   -42"
输出: -42
解释: 第一个非空白字符为 '-', 它是一个负号。
     我们尽可能将负号与后面所有连续出现的数字组合起来,最后得到 -42 。
示例 3:

输入: "4193 with words"
输出: 4193
解释: 转换截止于数字 '3' ,因为它的下一个字符不为数字。
示例 4:

输入: "words and 987"
输出: 0
解释: 第一个非空字符是 'w', 但它不是数字或正、负号。
     因此无法执行有效的转换。
示例 5:

输入: "-91283472332"
输出: -2147483648
解释: 数字 "-91283472332" 超过 32 位有符号整数范围。 
因此返回 INT_MIN (−231) 。

来源:力扣(LeetCode)
链接:https://leetcode-cn.com/problems/string-to-integer-atoi

2. 思路分析:

① 题目不难理解,首先最容易想到的是模拟整个的整数形成的过程,依次判断其中出现的各种可能情况,由于题目中涉及到的符号并不是特别多,只有空格、数字、正负号还有其他的符号,所以在循环中进行使用if判断各种情况还是可以做出来的,只是在做的时候可能没有考虑到某些数据导致结果错误,我在写模拟整个过程的时候错了很多遍,总是存在着某些情况没有考虑到的情况,不过好在领扣比较好的一点是可以看错误的测试数据这样在调试的时候才好知道哪里错了

② 模拟的思路如下:

1)首先是使用trim函数去掉字符串的前后空格,声明两个变量来记录是正数还是负数,声明两个String类型的变量用来判断当前形成的数字是否溢出的问题,还需要声明一个string类型的变量来表示当前合法的数字形成的字符串这样也可以很方便判断数字是否是溢出的情况,这里使用string类型的变量rec来判断是非常方便的,最大值为2147483647,最小值为2147483648这样就可以使用字符串中的compareto函数进行判断,因为当溢出的时候存在两种情况:一种是记录遍历rec超过了最大正数2147483647或者是最小负数-2147483648的长度10,第二种情况是当溢出的数字不是特别明显,比如像2147483648这样的数字或者是-2147483649的数字,使用compareto函数即可判断是否溢出,溢出的数字对应的记录字符串是大于对应的最大数字或者是最小数字对应的字符串的

2)声明两个变量记录是正数还是负数的话有一个好处是可以判断是否存在多个证号或者是负号的情况,比如像++1,-+1等等,我们在循环中即可判断之前是否已经出现过这些符号了

3)当当前的字符为数字的时候需要判断下一个符号是不是数字假如不是直接返回结果就可以了,因为这个时候没有判断的话存在这样的数据:727732+等提前判断就可以直接返回了

③ 使用if判断模拟整个过程调试比较麻烦因为总是存在这样那样的情况没有考虑到,不过最终还是可以解决的,写完模拟的代码之后看了一下官方的题解,使用的是有限状态机来解决的,使用这个方法来解决的话调试是很方便的,因为在数字的形成过程存在很多的状态的转换,所以需要借助于这个有限状态机的图标来描述整个过程状态的转换,实现起来也比较容易,最核心的是需要理清楚整个的状态转化图,将其转换为表格之后剩下来的实现就比较简单了,因为这个时候只需要将当前状态转换为下一个状态,官方提供的图解如下

④ 其实知道了使用自动机来解决,对于这道题目来说涉及到的状态转换不是特别多还是比较容易将上面过程画出来的,得到上面的图表之后剩下来的处理就相对简单了,我们需要将表格的数据初始化到数据结构中,因为使用的是java语言可以使用map来进行映射,键为当前的状态,对应上面每一行的字符串的值,值为表中列的值,可以使用List来连接多个字符串,我们在遍历的字符的时候需要判断出当前的字符是什么,那么就可以知道对应的是List中是哪一个位置的结果,表示当前遇到这个字符之后转化为哪一个新的状态,所以通过当前的状态与当前字符对应的位置那么就可以新的当前状态是什么,判断出得到的新的状态假如是数字的话那么就可以计算结果了,假如是负号的话那么就可以记录对应是正数还是负数了,得到的新的当前状态又可以最为下一次的的状态初值,说起来很绕,结合上面的图表就很好理解了

⑤ 官方的提供的自动机的思路是非常好的,也是我们需要学习的,省去了多个状态转变的if判断,调试也比较快,核心在于如何得到上面的状态转换图表,最终将这些图标存储到数据结构中即可轻松转变状态,不过对于这道题目来说我感觉另外一个难点是判断是否是溢出的问题,尝试了很多次才得到正确的结果

⑥ 还有一个可以学习的是如何再声明map与list的时候进行初始化数据

3. 代码如下:

自动机:

class Solution {
 public int myAtoi(String str) {
       /*使用有限状态机来解决*/
        /*可以学习一下怎么样在声明map与List的时候对其进行初始化*/
        /*参照自动状态机的表格来初始化数据*/
        Map<String, List<String>> map = new HashMap<String, List<String>>(){
            {
                put("start", new ArrayList<String>(){
                    {
                        add("start");
                        add("signed");
                        add("in_number");
                        add("end");
                    }
                });
                put("signed", new ArrayList<String>(){
                    {
                        add("end");
                        add("end");
                        add("in_number");
                        add("end");
                    }
                });

                put("in_number", new ArrayList<String>(){
                    {
                        add("end");
                        add("end");
                        add("in_number");
                        add("end");
                    }
                });

                put("end", new ArrayList<String>(){
                    {
                        add("end");
                        add("end");
                        add("end");
                        add("end");
                    }
                });
            }
        };
        String state = "start";
        int res = 0;
        int sign = 1;
        /*处理字符串中的状态*/
        for (int i = 0; i < str.length(); ++i){
            char c = str.charAt(i);
            /*下面这个方法是用来找到对应的是是四个字符中的哪一个这样才好在Map中的List中找到具体的索引*/
            int pos = getCurCharPos(c);
            state = map.get(state).get(pos);
            if (state.equals("in_number")){
                if (sign * (res * 10 + (c - '0')) >= Integer.MAX_VALUE || sign * (res * 10 + (c - '0')) <= Integer.MIN_VALUE|| res * 10 / 10 != res)
                return sign == 1 ? Integer.MAX_VALUE : Integer.MIN_VALUE;
                res = res * 10 + (c - '0');
            }else if (state.equals("signed")){
                sign = c == '-' ? -1 : 1;
            }
        }
        return sign * res;
    }

    /*对照自动状态机的列*/
    private int getCurCharPos(char c) {
        if (c == ' ') return 0;
        else if (c == '+' || c == '-') return 1;
        else if (c >= '0' && c <= '9') return 2;
        return 3;
    }
}

模拟:

class Solution {
  public int myAtoi(String str) {
        /*注意存在空串的情况*/
        /*trim函数去掉的是字符串前后左右的空格*/
        str = str.trim();
        if (str.equals("") || str.equals("-")) return 0;
        if (!(str.charAt(0) >= '0' && str.charAt(0) <= '9' || str.charAt(0) == ' ' || str.charAt(0) == '-' || str.charAt(0) == '+')) return 0;
        int len = str.length();
        String rec = "";
        /*负数的标记*/
        int isneg = 0;
        int res = 0;
        int ispos = 0;
        String min = "2147483648";
        String max = "2147483647";
        for (int i = 0; i < len; ++i){
            char c = str.charAt(i);
            if (c == '+' && ispos != 1 && isneg != 1){
                ispos = 1;
            }
            else if (c == '-' && ispos != 1 && isneg != 1) {
                isneg = 1;
            }
            else if (c >= '0' && c <= '9'){
                /*可能0的话是没有任何作用的而且会增加记录变量的长度*/
                if (rec.length() > 0 || c != '0') rec += c;
                if (isneg == 1 && (rec.length() > 10 || (rec.length() == 10 && rec.compareTo(min) >= 0))) return Integer.MIN_VALUE;
                else if (isneg == 0 && (rec.length() > 10 || (rec.length() == 10 && rec.compareTo(max) >= 0))) return Integer.MAX_VALUE;
                res = res * 10 + (c - '0');
                if (i + 1 < str.length() && !(str.charAt(i + 1) >= '0' && str.charAt(i + 1) <= '9')) {
                    if (isneg == 1) return -res;
                    return res;
                }
            }else break;
        }
        if (isneg == 0) return res;
        return -res;
    }
}

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值