题目描述(题目难度,中等)
给定两个以字符串形式表示的非负整数 num1
和 num2
,返回 num1
和 num2
的乘积,它们的乘积也表示为字符串形式。
示例 1:
输入: num1 = “2”, num2 = “3”
输出: “6”
示例 2:
输入: num1 = “123”, num2 = “456”
输出: “56088”
说明:
- num1 和 num2 的长度小于110。
- num1 和 num2 只包含数字 0-9。
- num1 和 num2 均不以零开头,除非是数字 0 本身。
- 不能使用任何标准库的大数类型(比如 BigInteger)或直接将输入转换为整数来处理。
来源:力扣(LeetCode)
链接:https://leetcode-cn.com/problems/multiply-strings
著作权归领扣网络所有。商业转载请联系官方授权,非商业转载请注明出处。
题目求解
下图以 99x999 为例,展示了模拟竖式计算的过程:
可以看到和我们自己手工竖式计算还是有区别的,一是我们习惯于右对齐,从右到左运算(这个其实无所谓,只要把任意两位的积累加到对应位置,无论按什么顺序都可以),二是我们习惯在列竖式时提前进位好,而编码时,不需要提前进位,最后统一进位即可。
虽说一个 m 位的数乘一个 n 位的数,乘积最多有 m+n 位。理论上应该申请长度为 m+n 的数组,但最高位其实已经没必要再往前进位了,所以申请长度为 m+n-1 的数组就够用了。
参考代码如下:
class Solution {
public String multiply(String num1, String num2) {
if(num1.equals("0") || num2.equals("0")) return "0";
int m = num1.length();
int n = num2.length();
int[] mul = new int[m+n-1]; // 元素默认值为 0
for(int i = 0; i < m; ++i) { // 竖式运算
for(int j = 0; j < n; ++j) {
int vi = num1.charAt(i) - 48;
int vj = num2.charAt(j) - 48;
mul[i+j] += vi*vj;
}
}
for(int i = m+n-2; i > 0; --i) { // 进位
mul[i-1] += mul[i]/10;
mul[i] %= 10;
}
StringBuilder result = new StringBuilder();
for(int i = 0; i < m+n-1; ++i) { // 结果拼接为字符串
result.append(mul[i]);
}
return result.toString();
}
}
假如两个大整数位数相同,都为 n,上面这个算法的时间复杂度为 O ( n 2 ) O(n^2) O(n2)。
Python对于大数相乘的实现使用的是卡拉祖巴(Karatsuba)算法,是一种分治算法,时间复杂度为 O ( n log 2 3 ) O(n^{{\log_2}^3}) O(nlog23)约等于 O ( n 1.58 ) O(n^{1.58}) O(n1.58)。
下面简单介绍一下大数相乘的分治法:
A
=
A
1
⋅
1
0
n
2
+
A
2
,
B
=
B
1
⋅
1
0
n
2
+
B
2
A=A_1\cdot10^{\frac{n}{2}}+A_2,B=B_1\cdot10^{\frac{n}{2}}+B_2
A=A1⋅102n+A2,B=B1⋅102n+B2
A ⋅ B = ( A 1 ⋅ 1 0 n 2 + A 2 ) ⋅ ( B 1 ⋅ 1 0 n 2 + B 2 ) = A 1 B 1 1 0 n + ( A 1 B 2 + A 2 B 1 ) 1 0 n 2 + A 2 B 2 A\cdot B=(A_1\cdot10^{\frac{n}{2}}+A_2)\cdot(B_1\cdot10^{\frac{n}{2}}+B_2)=A_1B_110^n+(A_1B_2+A_2B_1)10^{\frac{n}{2}}+A_2B_2 A⋅B=(A1⋅102n+A2)⋅(B1⋅102n+B2)=A1B110n+(A1B2+A2B1)102n+A2B2
上面未做任何特殊处理,将原式分解为了 A 1 B 1 , A 1 B 2 , A 2 B 1 , A 2 B 2 A_1B_1,A_1B_2,A_2B_1,A_2B_2 A1B1,A1B2,A2B1,A2B2四次乘法运算。
但由于 A 1 B 2 + A 2 B 1 = ( A 1 + A 2 ) ⋅ ( B 1 + B 2 ) − A 1 B 1 − A 2 B 2 A_1B_2+A_2B_1=(A_1+A_2)\cdot(B_1+B_2)-A_1B_1-A_2B_2 A1B2+A2B1=(A1+A2)⋅(B1+B2)−A1B1−A2B2
所以 A ⋅ B = A 1 B 1 1 0 n + [ ( A 1 + A 2 ) ⋅ ( B 1 + B 2 ) − A 1 B 1 − A 2 B 2 ] 1 0 n 2 + A 2 B 2 A\cdot B=A_1B_110^n+[(A_1+A_2)\cdot(B_1+B_2)-A_1B_1-A_2B_2]10^{\frac{n}{2}}+A_2B_2 A⋅B=A1B110n+[(A1+A2)⋅(B1+B2)−A1B1−A2B2]102n+A2B2
可以看到原本的四次乘法运算变成了 A 1 B 1 , A 2 B 2 , ( A 1 + A 2 ) ⋅ ( B 1 + B 2 ) A_1B_1,A_2B_2,(A_1+A_2)\cdot(B_1+B_2) A1B1,A2B2,(A1+A2)⋅(B1+B2)三次乘法运算。
现在的时间复杂度为: T ( n ) = 3 T ( n 2 ) + θ ( n ) T(n)=3T(\frac{n}{2})+\theta(n) T(n)=3T(2n)+θ(n),根据主定理可得 T ( n ) = O ( n log 2 3 ) T(n)=O(n^{{\log_2}^3}) T(n)=O(nlog23)。
同样的道理,如果 A,B 位数不同,同样有下式成立:
A
⋅
B
A\cdot B
A⋅B
=
(
A
1
⋅
1
0
m
2
+
A
2
)
⋅
(
B
1
⋅
1
0
n
2
+
B
2
)
=(A_1\cdot10^{\frac{m}{2}}+A_2)\cdot(B_1\cdot10^{\frac{n}{2}}+B_2)
=(A1⋅102m+A2)⋅(B1⋅102n+B2)
=
A
1
B
1
1
0
m
+
n
2
+
A
1
B
2
1
0
m
2
+
A
2
B
1
1
0
n
2
+
A
2
B
2
=A_1B_110^{\frac{m+n}{2}}+A_1B_210^{\frac{m}{2}}+A_2B_110^{\frac{n}{2}}+A_2B_2
=A1B1102m+n+A1B2102m+A2B1102n+A2B2
=
2
A
1
B
1
1
0
m
+
n
2
+
2
A
2
B
2
+
(
A
1
⋅
1
0
m
2
−
A
2
)
⋅
(
B
2
−
B
1
⋅
1
0
n
2
)
=2A_1B_110^{\frac{m+n}{2}}+2A_2B_2+(A_1\cdot10^{\frac{m}{2}}-A_2)\cdot(B_2-B_1\cdot10^{\frac{n}{2}})
=2A1B1102m+n+2A2B2+(A1⋅102m−A2)⋅(B2−B1⋅102n)
C++ 的大数相乘是用 FFT(快速傅里叶变换)实现的,可以将大数相乘的时间复杂度优化到 O ( n log n ) O(n\log n) O(nlogn)。FFT 有点复杂,大家感兴趣的可以去搜一下,网上资料也挺多的。