整理自学堂在线 邓俊辉老师的《数据结构与算法》
http://www.xuetangx.com/courses/course-v1:TsinghuaX+30240184X+sp/courseware/706d387daf2d4495aeb7fea3246a82ce/2634c8bbe1574bd8823dafc9e6ca63d2/
有序向量唯一化
低效算法:
原理:在有序向量中,重复的元素必然相互紧邻构成一个区间,因此,每一个区间只需要保留单个元素即可
template <typename T>
int Vector<T>::uniquify()
{
int oldSize=_size;
int i=0;
while(i<_size-1)
(_elem[i]==_elem[i+1]?remove(i+1):i++;
return oldSize-_size;
}
运行时间主要取决于while循环,次数共计:_size-1=n-1
最坏情况下,每次都要调用remove(),耗时O(n-1)~O(1);累计O(n^2)
反思:低效的根源在于,同一元素可作为被删除元素的后继多次前移
启示:若能以重复区间为单位,成批删除雷同元素,性能必将改进
高效算法:
template<typename T>
int Vector<T>::uniquify()
{
Rank i=0,j=0;//各对互异“相邻”元素的秩
while(++j<_size)//逐一扫描,直至末元素
//跳过雷同者;发现不同元素时,向前移至紧邻于前者右侧
if(_elem[i]!=_elem[j])_elem[++i]=_elem[j];
_size=++i;shrink();//直接截除尾部多余元素
return j-i;//向量规模变化量,即被删除元素总数
}//注意:通过remove(lo,hi)批量删除,依然不能达到高效率
共n-1次迭代,每次常数时间,累计O(n)时间