题目
给定一个排序数组,你需要在原地删除重复出现的元素,使得每个元素只出现一次,返回移除后数组的新长度。
不要使用额外的数组空间,你必须在原地修改输入数组并在使用 O(1) 额外空间的条件下完成。
示例 1:
给定数组 nums = [1,1,2],
函数应该返回新的长度 2, 并且原数组 nums 的前两个元素被修改为 [1,2]
你不需要考虑数组中超出新长度后面的元素。
示例 2:
给定 nums = [0,0,1,1,1,2,2,3,3,4],
函数应该返回新的长度 5, 并且原数组 nums 的前五个元素被修改为 [0,1,2,3,4]
你不需要考虑数组中超出新长度后面的元素。
说明:
为什么返回数值是整数,但输出的答案是数组呢?
请注意,输入数组是以“引用”方式传递的,这意味着在函数里修改输入数组对于调用者是可见的。
你可以想象内部操作如下:
// nums 是以“引用”方式传递的。也就是说,不对实参做任何拷贝
int len = removeDuplicates(nums);
// 在函数里修改输入数组对于调用者是可见的。
// 根据你的函数返回的长度, 它会打印出数组中该长度范围内的所有元素。
for (int i = 0; i < len; i++) {
print(nums[i]);
}
我的答案
思路:设置两个变量save和after,after指向现在正在观察的数组下标,save用于暂存所遇见的最新的一串重复数字的第一个的下标。初始化为after指向0,save强制设置为nums[after]+1。由于观察到当nums[save]的值和当前nums[after]的值不同时表示after开始指向新的一串重复的数字,则应该更新save的值指向after;当nums[after]和nums[save]相同时,表示after正指向一串重复数字中的一个,则应删除。
class Solution(object):
def removeDuplicates(self, nums):
"""
:type nums: List[int]
:rtype: int
"""
if (len(nums) <= 1):
return len(nums)
else:
i = 0
after = nums[i]
save = after + 1
while (True):
if (i <= len(nums) - 1):
if save != after:
save = after
if(i==len(nums)-1):
break
after = nums[i + 1]
i = i + 1
else:
del nums[i]
if(len(nums)==1 or len(nums)<=i):
break
after=nums[i]
else:
break
return len(nums)
用时:104ms
打败:40.19%
高分答案
class Solution(object):
def removeDuplicates(self, nums):
"""
:type nums: List[int]
:rtype: int
"""
if(len(nums) == 0):
return 0
i = 1
j = 1
while(j < len(nums)):
if(nums[j-1] == nums[j]):
j += 1
else:
nums[i] = nums[j]
j += 1
i += 1
return i
用时:48ms
分析
1.看完了高分的解答,明白问题在哪。首先,对题意的理解,个别字眼比如说,“你不需要考虑数组中超出新长度后面的元素。”当时没有很明确的明白是什么意思。其实就是题目介绍中的“原地”二字的含义(原地算法)。在高分解答中就很好的体现了:程序并没有使用 del 函数删除数组中的元素,而仅仅是用了将数组中的元素移位的方法,将需要的元素移到数组的前端,而整个数组的实际长度并未改变。没有del操作意味着节约了很多时间:首先是因为del函数本身会比赋值操作费时;另一个原因是由于有了del类的操作,在边界条件下比如当数组长度为1的时候del是比较危险的,在下一个循环容易index out of range,因而不得不加上判断操作,又会费时。
2.我在本题中,使用了两个变量,save和after,而高分解答仅仅使用一个变量j作为遍历数组的变量,这样控制起来既安全又简单,省去了很多不必要的边界检查,仅仅用i表示有效的数组长度而不依赖于len函数。非常巧妙的用当nums[j]和[j-1]相等时不停的向右滑动指针,简约的达到我多次del的目的,和快速排序中的从数组两边往中间滑动的操作有异曲同工之妙。
3.即使我使用了笨重的del和来两个变量,也不得不谈谈这种情况下的边界检查。一旦涉及变量遍历下标的时候,要检查上界;另外在有del的时候要检查数组的长度是否可以进行;有循环的时候要考虑本次的操作会不会造成下一次操作的index出问题;另外要考虑操作什么时候算是终结,以前一次考试被python数组坑惨了,希望以后慢慢注意。