第一章表-ArrayList数据结构

最新推荐文章于 2024-09-12 12:30:29 发布

闽农qq:994955138

最新推荐文章于 2024-09-12 12:30:29 发布

阅读量147

点赞数

分类专栏： Java数据结构与算法文章标签：数据结构 java android

本文链接：https://blog.csdn.net/MarketAndTechnology/article/details/113715875

版权

Java数据结构与算法专栏收录该内容

4 篇文章 0 订阅

订阅专栏

我们在序言中讲过ArrayList的数据结构，他的数据存储方式是数组。这一章我们结合源代码来细讲他的实现和一些API的用法。

public class ArrayList<E> extends AbstractList<E>
        implements List<E>, RandomAccess, Cloneable, java.io.Serializable
{
    private static final long serialVersionUID = 8683452581122892189L;

    transient Object[] elementData; // non-private to simplify nested class access

    /**
     * The size of the ArrayList (the number of elements it contains).
     *
     * @serial
     */
    private int size;

我们可以看到ArrayList继承了AbstractList，实现接口List接口，并且实现了序列化。接下来我们看看他的构造函数。

public ArrayList(int initialCapacity) {
    if (initialCapacity > 0) {
        this.elementData = new Object[initialCapacity];
    } else if (initialCapacity == 0) {
        this.elementData = EMPTY_ELEMENTDATA;
    } else {
        throw new IllegalArgumentException("Illegal Capacity: "+
                                           initialCapacity);
    }
}

/**
 * Constructs an empty list with an initial capacity of ten.
 */
public ArrayList() {
    this.elementData = DEFAULTCAPACITY_EMPTY_ELEMENTDATA;
}

我们可以在创建实例的时候，既可以自己传入表长度，也可以使用系统默认的长度为0的表。

我们可以看到this.elementData便是一个用来存储数据的 Object类型数组。

接下来看一些API的实现

1.add

  public boolean add(E e) {
    ensureCapacityInternal(size + 1);  // Increments modCount!!
    elementData[size++] = e;
    return true;
  }

  private void ensureCapacityInternal(int minCapacity) {
    if (elementData == DEFAULTCAPACITY_EMPTY_ELEMENTDATA) {
        minCapacity = Math.max(DEFAULT_CAPACITY, minCapacity);
    }

    ensureExplicitCapacity(minCapacity);
  }

  private void ensureExplicitCapacity(int minCapacity) {
    modCount++;

    // overflow-conscious code
    if (minCapacity - elementData.length > 0)
        grow(minCapacity);
  }

  private void grow(int minCapacity) {
    // overflow-conscious code
    int oldCapacity = elementData.length;
    int newCapacity = oldCapacity + (oldCapacity >> 1);
    if (newCapacity - minCapacity < 0)
        newCapacity = minCapacity;
    if (newCapacity - MAX_ARRAY_SIZE > 0)
        newCapacity = hugeCapacity(minCapacity);
    // minCapacity is usually close to size, so this is a win:
    elementData = Arrays.copyOf(elementData, newCapacity);
  }

我们可以看到，添加数据默认在末尾添加，并且根据存储数组的长度来判断是否要增加数组长度。增加数组的长度是通过创建一个新数组，并且把数据复制过去。实际上也就是新建数组，并且指针转移。

2.remove

  public boolean remove(Object o) {
    if (o == null) {
        for (int index = 0; index < size; index++)
            if (elementData[index] == null) {
                fastRemove(index);
                return true;
            }
    } else {
        for (int index = 0; index < size; index++)
            if (o.equals(elementData[index])) {
                fastRemove(index);
                return true;
            }
    }
    return false;
  }

  private void fastRemove(int index) {
    modCount++;
    int numMoved = size - index - 1;
    if (numMoved > 0)
        System.arraycopy(elementData, index+1, elementData, index,
                         numMoved);
    elementData[--size] = null; // clear to let GC do its work
 }

移除的时候是直接把index后面的所有数据往前面移动，然后把最后一个置空。注意：存储数组并没有改变长度，只是把最后一个存储的内容置空了。

3.addAll

  public boolean addAll(Collection<? extends E> c) {
    Object[] a = c.toArray();
    int numNew = a.length;
    ensureCapacityInternal(size + numNew);  // Increments modCount
    System.arraycopy(a, 0, elementData, size, numNew);
    size += numNew;
    return numNew != 0;
 }

addAll最多只执行一次数组扩容和数据复制。

4.removeAll

 public boolean removeAll(Collection<?> c) {
    Objects.requireNonNull(c);
    return batchRemove(c, false);
 }

private boolean batchRemove(Collection<?> c, boolean complement) {
    final Object[] elementData = this.elementData;
    int r = 0, w = 0;
    boolean modified = false;
    try {
        for (; r < size; r++)
            if (c.contains(elementData[r]) == complement)
                elementData[w++] = elementData[r];
    } finally {
        // Preserve behavioral compatibility with AbstractCollection,
        // even if c.contains() throws.
        if (r != size) {
            System.arraycopy(elementData, r,
                             elementData, w,
                             size - r);
            w += size - r;
        }
        if (w != size) {
            // clear to let GC do its work
            for (int i = w; i < size; i++)
                elementData[i] = null;
            modCount += size - w;
            size = w;
            modified = true;
        }
    }
    return modified;
}

批量移除的方法比较复杂，主要是这一段

for (; r < size; r++)

if (c.contains(elementData[r]) == complement)

elementData[w++] = elementData[r];

这一段的意思是把不需要移除的项拿出来，从原数组第一个开始逐个往后覆盖原数组。最后得到的就是不需要移除的n个项会依次排列在数组的前面，而从n往后面的项置空，则就得到了最后不需要移除的项组成的数组。这里w在项不需要移除r项的时候会自增，并且通过r的每次都递增来得到当前项，把r项放到w项。到需要移除的r项时，w项则不自增使得并且不赋值，使得r项被遗弃。

用语言描述可能有点难以理解，我们用画图的形式来说明

因为contains里面也涉及查找元素，所以批量删除时间复杂度O(M*N)，会比较消耗时间。

5.remove(Object)

public boolean remove(Object o) {
    if (o == null) {
        for (int index = 0; index < size; index++)
            if (elementData[index] == null) {
                fastRemove(index);
                return true;
            }
    } else {
        for (int index = 0; index < size; index++)
            if (o.equals(elementData[index])) {
                fastRemove(index);
                return true;
            }
    }
    return false;
}

private void fastRemove(int index) {
    modCount++;
    int numMoved = size - index - 1;
    if (numMoved > 0)
        System.arraycopy(elementData, index+1, elementData, index,
                         numMoved);
    elementData[--size] = null; // clear to let GC do its work
}

单个移除的时候需要找到这个项的index,再从index开始把后面的所有项前移，然后最后一个项置空。所以时间复杂度最坏的情况下是O(N*N)。

6.clear

  public void clear() {
    modCount++;

    // clear to let GC do its work
    for (int i = 0; i < size; i++)
        elementData[i] = null;

    size = 0;
 }

时间复杂度为N

7.contains

public boolean contains(Object o) {
    return indexOf(o) >= 0;
}

public int indexOf(Object o) {
    if (o == null) {
        for (int i = 0; i < size; i++)
            if (elementData[i]==null)
                return i;
    } else {
        for (int i = 0; i < size; i++)
            if (o.equals(elementData[i]))
                return i;
    }
    return -1;
}

时间复杂度O(N)

8.retainAll 取两个表的交集

public boolean retainAll(Collection<?> c) {
    Objects.requireNonNull(c);
    return batchRemove(c, true);
}

private boolean batchRemove(Collection<?> c, boolean complement) {
    final Object[] elementData = this.elementData;
    int r = 0, w = 0;
    boolean modified = false;
    try {
        for (; r < size; r++)
            if (c.contains(elementData[r]) == complement)
                elementData[w++] = elementData[r];
    } finally {
        // Preserve behavioral compatibility with AbstractCollection,
        // even if c.contains() throws.
        if (r != size) {
            System.arraycopy(elementData, r,
                             elementData, w,
                             size - r);
            w += size - r;
        }
        if (w != size) {
            // clear to let GC do its work
            for (int i = w; i < size; i++)
                elementData[i] = null;
            modCount += size - w;
            size = w;
            modified = true;
        }
    }
    return modified;
}

算法跟removeAll差不多，唯一不同的就是取相同项排列到数组前端，后面的项舍弃。

这样取交集的方法方法比下面的方法可取

ArrayList a;

ArrayList b;

ArrayList c;

for(Object o :a){

if(b.contains(a)){

c.add(a);//add会涉及到数组扩容和数据复制。增大时间复杂度。

}

9.trimToSize 将数组长度设置为数据长度。

public void trimToSize() {
    modCount++;
    if (size < elementData.length) {
        elementData = (size == 0)
          ? EMPTY_ELEMENTDATA
          : Arrays.copyOf(elementData, size);
    }
}

我们在移除数据的时候，只是将数组的某一项置空，并没有缩小数组。当有大量的数据被移除时，建议调用这个函数。应为这是一串连续的内存，数据移除后，数组索引还在，所以仍然被占用。Arrays.copyOf会新建一个长度适合的数组，而释放之前的数组引用。

注意：1.在添加数据的时候，如果频繁的拓展数组长度就要不断的新建数组，转移数据。这会大大增加时间复杂度。所以能使用addAll一次性添加的，尽量不要重复用add单个元素。如果能多个一起删除的，尽量不要重复用remove单个元素移除。

2.在移除数据的时候，如果能用removeAll的情况尽量用removeAll不要逐个的remove，否则时间复杂度会很大。

3.retainAll是取两个列表交集的很好的算法。

4.有大量数据移除时记得调用trimToSize