最长子串练习：圆周率前50位的最长子段和_3.141592653589793238462643383279502884197169399375-CSDN博客

本文链接：https://blog.csdn.net/ordinary_brony/article/details/112618670

文章目录

导读
题目说明
读题
前提说明
开始
- 分离
- 暴力破解子段和
思考优化
“非暴力不合作”
动态规划

导读

这里是一个有关最长子串的练习题，因为很有意思就记录一下。

题目说明

下面给出圆周率的前 $50$ 位，给出每位数字减掉 $5$ 后的序列，并计算新序列的最大子段和。

$3.14159, 26535, 89793, 23846, 26433, 83279, 50288, 41971, 69399, 37510$

读题

题目首先给出了 $52$ 个字符，也就是从 $3$ 开始一直到 $0$ 之间包括小数点。我们要把这些全部放进数组，并且每一位数字减去 $5$ ，最终找出一个最大子段和。

前提说明

首先，我们确认环境：Python $3.8.5$

然后看看题，既然给出了小数，那我们直接把小数一次次乘以 $10$ ，每次取出整数部分并减掉，不就完了？

答案是不行的。

虽然Python中有一个Decimal格式能够保存 $50$ 位甚至更多位的小数，但是不能保存一开始就给出的数字，而只能够保存计算得出的数字。

也就是说像这样：

import decimal

if __name__ == '__main__':
  decimal.getcontext().prec = 50
  print(decimal.Decimal(1)/decimal.Decimal(3))  
  pass

才能够显示 $50$ 位小数，也就是

$0.33333, 33333, 33333, 33333, 33333, 33333, 33333, 33333, 33333, 33333$

而直接给出的 $50$ 位小数则会在转换的过程中因为没办法表示直接溢出并丢弃。

所以，题目给出的

$3.14159, 26535, 89793, 23846, 26433, 83279, 50288, 41971, 69399, 37510$

没有办法作为直接给出的数字计算，甚至都不能使用str()函数进行处理，只能够当作字符串进行下一步处理，也就是：

num = '3.14159265358979323846264338327950288419716939937510'

只有这样才能被完好地处理。

开始

既然我们知道了只能作为字符串传进来，那么我们就开始吧：

分离

# 将数字分离出来，并每个数字减去同样的值
def divide(num, minus):
  # 把字符串变为数组
  array = list(num)
  # 移除不需要的小数点
  array.remove('.')
  # 每个字符转为数字并减去同样的值
  return [int(item) - minus for item in array]
  pass

之后我们就可以通过调用divide('3.1415926...'， 5)来获得我们需要计算最大子段和的数组了。

暴力破解子段和

遇事不决不如先来几层循环暴力破解。

既然是子段和，也就是确定子段起始点和子段结束点后全部加起来的大小。于是马上就能出来：

def violate(array):
  # 子段和
  temp = 0
  # 最终确认的子段和
  sum = 0
  # 记录起始位置
  start = 0
  # 记录结束位置
  end = 0
  # 三循环
  for i in range(0, len(array)):
    for j in range(i, len(array)):
      temp = 0
      for k in range(i, j):
        temp += array[k]
        pass
      # 因为要求最大的子段，所以我们和相等的情况会拉长子段
      if temp >= sum:
        # 记录起始位置
        start = i
        # 由于第三层循环中的range(i,j)中最大只有j-1，所以end取j-1
        end = j - 1
        # 记录和
        sum = temp
      pass
    pass
  # 输出，其中array[start:end]中又最多只能输出到array[end-1]，所以最后还得加上去
  print(f'start: {start}, end: {end}, length: {end - start}, array: {array[start : end + 1]}, sum: {sum}')
  pass

看着还不错。

我们把完整的代码放上去跑一下：

import math
# 分割字符串
def divide(num, minus):
  array = list(num)
  array.remove('.')
  return [int(item) - minus for item in array]
  pass
# 暴力破解
def violate(array):
  temp = 0
  sum = 0
  start = 0
  end = 0
  for i in range(0, len(array)):
    for j in range(i, len(array)):
      temp = 0
      for k in range(i, j):
        temp += array[k]
        pass
      if temp >= sum:
        start = i
        end = j - 1
        sum = temp
      pass
    pass
  print(f'start: {start}, end: {end}, length: {end - start}, array: {array[start : end + 1]}, sum: {sum}')
  pass
# 主函数
if __name__ == '__main__':
  raw = divide('3.14159265358979323846264338327950288419716939937510', 5)
  violate(raw)
  pass

于是输出了：start: 34, end: 48, length: 14, array: [3, 3, -1, -4, 4, 2, -4, 1, 4, -2, 4, 4, -2, 2, 0], sum: 14

没毛病。

我们来肉眼估计一下时间复杂度：三层for循环，大概是 $O(n^3)$

思考优化

可是这三层循环也太累赘了。打个比方的话，就相当于初中时候的相遇问题中加了一个像疯狗一样在两个相遇的个体间不停地来回折返跑的个体。脑子里除了为这只疯狗感到担忧，就只剩下对自己的担忧了。

那么，问题就在于：怎么无视掉这只疯狗？那就是坐在旁边看着。

# 暴力破解（优化版）
def violation(array):
  temp = 0
  sum = 0
  start = 0
  end = 0
  for i in range(0, 50):
    temp = 0
    for j in range(i, 50):
      temp += array[j]
      if (temp >= sum):
        sum = temp
        start = i
        end = j
        pass
      pass
    pass
  print(f'start: {start}, end: {end}, length: {end - start}, array: {array[start : end + 1]}, sum: {sum}')
  pass

于是就有了输出：

start: 34, end: 48, length: 14, array: [3, 3, -1, -4, 4, 2, -4, 1, 4, -2, 4, 4, -2, 2, 0], sum: 14

一样的输出诶！

看起来还不错。再来个肉眼估计，两层for循环，大概是 $O(n^2)$ 。这可比刚刚的循环好多了。现在是 $50$ 个数据，差距大概是 $50^3-50^2=12250$ 次运算。如果是万级数据，差距会更加明显。

“非暴力不合作”

~~这个标题可能有点搞事情，不过别在意这些细节。~~

说实在的，暴力破解还是有点累赘。有没有再优化一点的方法？那当然是动态规划。

动态规划

怎么说？核心思想，就是一遍过完所有的数据。

怎么做？我们不如画个图。

为什么这么做？因为我们需要的是最大，而且给出的数据集中存在非负数，所以小于零的我们就不关注了。一旦检测到负数，我们就直接剪枝，只记录一下直到这之前的最大子段。然后，接下来就是用新的非负数代替新的子段起始位置。

举个例子，我们在这里拿到的数据是这样的（截取部分举例）：

$- 2, - 4, - 1, - 4, 0, 4, - 3, 1, 0, - 2, 0, 3, 4, 2, 4, . . .$

首先找一个非负数，也就是第 $5$ 位的 $0$
然后从这里开始接着往后一边走一边累加，也就是：
- $0, 4$ 累加得 $4$ ，记录存档点；
- $0, 4, - 3$ 累加得 $1$ ，未能高过前存档点，不覆盖；
- $0, 4, - 3, 1$ 累加得 $2$ ，未能高过存档点，不覆盖；
- $0, 4, - 3, 1, 0$ 累加得 $2$ ，未能高过存档点，不覆盖；
- $0, 4, - 3, 1, 0, - 2$ 累加得 $0$ ，未能高过存档点，不覆盖；
- $0, 4, - 3, 1, 0, - 2, 0$ 累加得 $0$ ，未能高过存档点，不覆盖；
- $0, 4, - 3, 1, 0, - 2, 0, 3$ 累加得 $3$ ，未能高过存档点，不覆盖；
- $0, 4, - 3, 1, 0, - 2, 0, 3, 4$ 累加得 $7$ ，高过存档点，覆盖前存档点；
- $0, 4, - 3, 1, 0, - 2, 0, 3, 4, 2$ 累加得 $9$ ，高过存档点，覆盖前存档点；
- $0, 4, - 3, 1, 0, - 2, 0, 3, 4, 2, 4$ 累加得 $13$ ，高过存档点，覆盖前存档点；
……

这就是大致的步骤。如果在后面的计算中遇到了负数，我们就直接把这个子段停掉，重新开始子段计算。打个比方的话就像是嗦面嗦到一半用牙齿咬断一样。

既然有了思路，我们就开始编码：

def dynamic(array):
  temp = 0
  sum = 0
  start = 0
  end = 0
  for index in range(0, len(array)):
    if temp + array[index] > array[index]:
      temp += array[index]
    else:
      temp = array[index]
      start = index
      pass
    if temp >= sum:
      sum = temp
      end = index
      pass
    pass
  print(f'start: {start}, end: {end}, length: {end - start}, array: {array[start : end + 1]}, sum: {sum}')
  pass