Bài 20 / 38~22 phútGenerics & CollectionsMiễn phí… lượt xem

List và Queue — ArrayList, LinkedList, ArrayDeque, PriorityQueue

Q: Vì sao ArrayDeque thường nhanh hơn LinkedList cho stack/queue

3 lý do kỹ thuật: Memory layout : ArrayDeque dùng array liền kề (circular buffer). LinkedList mỗi element là node object rải rác heap. Cache locality : iterate/peek ArrayDeque → cache hit. LinkedList → cache miss mỗi next. Allocation : ArrayDeque chỉ alloc array 1 lần (resize khi đầy). LinkedList alloc 1 node mỗi add — GC pressure. 1M push = 1M node object = 40MB garbage. Benchmark điển hình (1M push/pop): ArrayDeque : ~10ms. LinkedList : ~50-100ms (tuỳ GC). Stack legacy: ~150ms (synchronized overhead). Quy tắc modern Java: cần stack/queue không thread-safe → ArrayDeque . Stack class extends Vector , synchronized mọi method vô ích — không dùng.

Q: Đoạn sau tính total chậm thế nào với LinkedList 10k element? `LinkedList list = new LinkedList (); for (int i = 0; i , answer: ( LinkedList.get(i) là O(n) — phải duyệt từ đầu đến index i . Loop chạy n lần × O(n) mỗi get = O(n²) . Với n = 10k → ~50 triệu operation. Chậm vài giây. Với n = 1M → 500 tỉ → treo. Fix : Đổi sang ArrayList — get(i) O(1), loop O(n). Dùng for-each : for (int x : list) sum += x; — iterator next() O(1), tổng O(n) kể cả LinkedList. Bài học: biết Big-O từng operation của implementation bạn dùng. )

LinkedList.get(i) là O(n) — phải duyệt từ đầu đến index i . Loop chạy n lần × O(n) mỗi get = O(n²) . Với n = 10k → ~50 triệu operation. Chậm vài giây. Với n = 1M → 500 tỉ → treo. Fix : Đổi sang ArrayList — get(i) O(1), loop O(n). Dùng for-each : for (int x : list) sum += x; — iterator next() O(1), tổng O(n) kể cả LinkedList. Bài học: biết Big-O từng operation của implementation bạn dùng.

Q: Khi nào dùng PriorityQueue ? Cho ví dụ.

PriorityQueue = binary heap. offer/poll O(log n), peek O(1). Dùng khi cần lấy element "nhỏ nhất" (hoặc lớn nhất) lặp đi lặp lại. Ví dụ thực tế: Top-K : tìm 10 request chậm nhất trong 1 giờ. Duy trì PQ size 10, offer mỗi request, poll nếu size vượt 10 → cuối cùng 10 request lớn nhất. Task scheduling : worker lấy task priority cao nhất. PriorityQueue<Task> với Comparator theo priority. Dijkstra shortest path : lấy node chưa visit có distance min. Merge K sorted list : push head mỗi list, pop min, push next từ cùng list. Khác TreeSet : PriorityQueue chỉ truy cập root O(1), không iterate sorted. TreeSet cho iterate sorted nhưng slower insert.

Q: Vì sao ArrayList grow 1.5x mỗi lần resize thay vì 2x

Hai lý do chính: Tái sử dụng bộ nhớ: với hệ số 2x, mảng mới luôn lớn hơn tổng tất cả mảng cũ đã giải phóng (2ⁿ so với 2ⁿ − 1) → allocator không bao giờ tái dùng được vùng trống cũ, gây phân mảnh heap. Với 1.5x — nhỏ hơn tỷ lệ vàng φ ≈ 1.618 — chỉ sau vài lần resize, tổng vùng đã giải phóng đủ chứa mảng mới → tái sử dụng được. Lãng phí ít hơn: ngay sau resize, hệ số 2x có thể thừa tới 50% slot trống; 1.5x chỉ thừa tối đa ~33% — đổi lại resize diễn ra thường xuyên hơn một chút, nhưng chi phí add vẫn giữ O(1) amortized. Nên khởi tạo 'new ArrayList (expectedSize)' khi biết trước số phần tử (batch load, đọc file, copy collection) — triệt tiêu toàn bộ chu kỳ resize + copy, nhanh hơn rõ rệt với list lớn.

Memory layout chi tiết của ArrayList (array liền kề, cache-friendly) vs LinkedList (node rải rác, cache miss). ArrayDeque circular buffer. PriorityQueue binary heap. Vì sao Big-O không nói hết câu chuyện.

Chọn ArrayList hay LinkedList? Hỏi 100 dev Java, 70% trả lời "LinkedList insert nhanh hơn". Viết code benchmark đo thực tế, ArrayList luôn nhanh hơn kể cả khi insert ở giữa — bất ngờ với hầu hết mọi người.

Lý do nằm ở cơ chế implementation bên dưới: ArrayList lưu trên vùng memory liền kề (contiguous array) — CPU cache load 1 page = 64 element cùng lúc, iterate như đi trên đường cao tốc. LinkedList lưu mỗi element ở 1 node với 2 pointer (prev/next), node rải rác heap — iterate như nhảy qua nhiều ô không liên quan, mỗi lần nhảy CPU cache miss, đọc memory chậm gấp 100 lần cache hit.

Big-O không nói hết câu chuyện. LinkedList.add(middle) là O(1) nếu đã có iterator tại vị trí đó, nhưng tìm vị trí lại là O(n) + bị cache miss dày đặc. Thực tế chậm hơn ArrayList.add(middle) O(n) — vì ArrayList chỉ memcpy một khối memory liền kề, CPU optimize cực tốt.

Bài này giải thích tại sao mỗi implementation có đặc tính như vậy từ cách lưu trữ memory. Phạm vi: các implementation của List, Queue, Deque. Map/Set ở bài tiếp theo.

Hiểu được, bạn không bao giờ chọn sai collection nữa.

1. Cây interface — bức tranh tổng

flowchart TD
    Iterable --> Collection
    Collection --> List
    Collection --> Set
    Collection --> Queue
    Queue --> Deque

    List -.-> ArrayList
    List -.-> LinkedList
    Deque -.-> ArrayDeque
    Deque -.-> LinkedList
    Queue -.-> PriorityQueue

Iterable — gốc, duy nhất có iterator(). Cho phép for-each.
Collection — extends Iterable, thêm add, remove, size, contains.
List — có thứ tự + index, cho phép trùng.
Queue — FIFO semantic (first-in-first-out).
Deque — double-ended queue, add/remove 2 đầu. Dùng làm stack luôn.

Interface là hợp đồng. Implementation là cách thực hiện hợp đồng đó trên memory — và đây là nơi quyết định performance.

2. `ArrayList` — contiguous array, cache-friendly

Cấu trúc bên dưới

public class ArrayList<E> {
    private Object[] elementData;   // Mang noi bo
    private int size;               // So element thuc te (<= elementData.length)

    private static final int DEFAULT_CAPACITY = 10;
}

Chỉ 2 field chính: 1 array Java, 1 int size. Element lưu trong elementData liền kề trong memory.

Memory layout

elementData: [A][B][C][D][E][ ][ ][ ][ ][ ]
              0  1  2  3  4  5  6  7  8  9
                                size=5  capacity=10

Array Java là contiguous memory — 10 slot cạnh nhau trong heap, mỗi slot lưu reference (4 hoặc 8 byte tuỳ 32/64-bit JVM). Tổng block 10*8 = 80 byte liền kề.

`get(i)` — O(1) đúng nghĩa

public E get(int index) {
    return (E) elementData[index];
}

Array access = tính địa chỉ base + index * 8, fetch 1 memory location. O(1) chính xác.

Cache advantage: CPU load 64 byte (1 cache line) mỗi lần. elementData[0] đọc → CPU cache cả 8 slot đầu. Truy cập elementData[1..7] sau đó không cần đọc memory — từ cache, ~1ns. So với main memory ~100ns, nhanh 100 lần.

Đây là lý do iterate ArrayList cực nhanh — mỗi lần đọc memory load 8 element, 7 element tiếp theo từ cache.

`add(e)` tail — O(1) amortized

public boolean add(E e) {
    if (size == elementData.length) {
        grow();   // Cap phat array lon hon, copy
    }
    elementData[size++] = e;
    return true;
}

private void grow() {
    int oldCapacity = elementData.length;
    int newCapacity = oldCapacity + (oldCapacity >> 1);   // 1.5x
    elementData = Arrays.copyOf(elementData, newCapacity);
}

Bình thường: elementData[size++] = e — O(1), 1 memory write.

Khi mảng đầy: grow() sẽ được kích hoạt để cấp phát một mảng mới có kích thước lớn hơn 1.5 lần so với mảng cũ, sau đó sử dụng Arrays.copyOf để copy toàn bộ các phần tử cũ sang mảng mới.

💎 Vì sao hệ số tăng là 1.5x (`ArrayList`) mà không phải 2x (`Vector`, `HashMap`)?

Tại sao các kỹ sư Java thiết kế hệ số tăng kích thước của ArrayList là 1.5 (oldCapacity + (oldCapacity >> 1)) thay vì gấp đôi 2.0 như Vector hay HashMap? Đây là cân bằng giữa lãng phí bộ nhớ và khả năng tái sử dụng vùng nhớ đã giải phóng:

Tái sử dụng vùng nhớ đã giải phóng (memory block reuse): Mỗi lần resize, mảng cũ bị bỏ đi và vùng nhớ của nó được giải phóng. Câu hỏi quyết định: vùng trống tích luỹ từ các mảng cũ có đủ chỗ cho mảng mới không?
- Với k = 2: các mảng liên tiếp có kích thước C, 2C, 4C, ..., 2ⁿC. Mảng mới luôn lớn hơn tổng tất cả mảng cũ cộng lại (2ⁿ so với 1 + 2 + ... + 2ⁿ⁻¹ = 2ⁿ - 1). Vùng trống cũ không bao giờ đủ chỗ → allocator luôn phải xin vùng nhớ hoàn toàn mới, các vùng cũ thành "lỗ hổng" phân mảnh trên heap.
- Với k = 1.5: tổng quát, khi growth factor k nhỏ hơn tỷ lệ vàng φ ≈ 1.618 (điều kiện k² ≤ k + 1 — block mới fit vào không gian của các block giải phóng ngay trước đó), thì chỉ sau vài lần resize, vùng nhớ đã giải phóng đủ lớn để chứa mảng mới. Vì 1.5 nhỏ hơn 1.618, allocator có cơ hội cấp phát mảng mới ngay trên vùng cũ — giảm phân mảnh, dùng heap hiệu quả hơn.
Cân bằng hiệu năng (Trade-off Sweet Spot):
- Lãng phí bộ nhớ (Internal Fragmentation): Nếu chọn k quá lớn (ví dụ k = 2), ở trạng thái tệ nhất ngay sau khi resize, chúng ta có thể lãng phí tới 50% không gian mảng (khi chỉ thêm 1 phần tử vượt ngưỡng). Với k = 1.5, tỷ lệ lãng phí tối đa giảm xuống chỉ còn khoảng ~33%.
- Số lần cấp phát lại (Allocation Overhead): Nếu chọn k quá nhỏ (ví dụ 1.1 hay 1.2), mảng sẽ phải resize liên tục, tốn chi phí CPU để copy dữ liệu và tăng áp lực dọn rác cực nặng lên GC. Hệ số 1.5 giữ cho chi phí thêm phần tử luôn là O(1) amortized cực kỳ ổn định.
- Tối ưu hóa ở mức Bitwise: Phép toán oldCapacity + (oldCapacity >> 1) sử dụng toán tử dịch bit phải >> 1 (chia đôi) được thực hiện trực tiếp trên thanh ghi CPU chỉ trong 1 chu kỳ xung nhịp (clock cycle), tránh được lệnh chia số nguyên DIV vô cùng đắt đỏ ở mức phần cứng.

Mẹo tối ưu: Nếu biết trước số lượng phần tử tối đa, hãy luôn khởi tạo new ArrayList<>(expectedSize) hoặc gọi list.ensureCapacity(n) để triệt tiêu hoàn toàn quá trình resize mảng, đưa chi phí thêm phần tử về O(1) tuyệt đối.

`add(i, e)` giữa — O(n) nhưng nhanh thực tế

public void add(int index, E element) {
    if (size == elementData.length) grow();
    System.arraycopy(elementData, index, elementData, index + 1, size - index);
    elementData[index] = element;
    size++;
}

Dịch chuyển toàn bộ các phần tử sang phải 1 slot thông qua System.arraycopy.

⚡ Sức mạnh từ JVM Intrinsic: Tại sao `System.arraycopy` lại nhanh kinh ngạc?

Dù về mặt lý thuyết Big-O, việc dịch chuyển mảng là một thao tác O(n), nhưng thực tế benchmark cho thấy nó chạy nhanh đến mức không tưởng, thường đánh bại hoàn toàn việc chèn phần tử của LinkedList ở hầu hết mọi vị trí. Bí mật nằm ở chỗ:

JVM_ArrayCopy Intrinsic: System.arraycopy không phải là một hàm Java thông thường, cũng không hoạt động thông qua cơ chế JNI (Java Native Interface) truyền thống vốn đi kèm overhead chuyển đổi ngữ cảnh stack rất lớn. Nó là một JIT Intrinsic method được định nghĩa đặc biệt trong HotSpot JVM.
Ánh xạ trực tiếp sang CPU Assembly: Khi mã nguồn được biên dịch JIT (C2 compiler), HotSpot JVM sẽ nhận diện signature này và thay thế (inline) toàn bộ lệnh gọi hàm bằng các đoạn mã máy (assembly) tối ưu nhất của nền tảng phần cứng hiện tại. Lệnh này ánh xạ trực tiếp tới các hàm copy bộ nhớ cực mạnh ở cấp độ hệ thống như memcpy hoặc memmove.
Vector hóa bằng phần cứng: CPU hiện đại có các tập lệnh vectorized SIMD (như AVX-512, AVX2, SSE) có khả năng dịch chuyển hàng chục byte dữ liệu cùng một lúc trên thanh ghi. Trình JIT compiler sẽ sinh mã tận dụng các instruction này, kết hợp với các chỉ thị phần cứng siêu tối ưu như REP MOVSB / REP MOVSD trên kiến trúc x86-64 để copy và dịch chuyển hàng GB dữ liệu trên một giây.

Nhờ có sự tối ưu hóa phần cứng tuyệt đối này, chèn giữa trong ArrayList nhanh hơn rất nhiều so với LinkedList vì:

Tối ưu hóa ghi nhớ liền kề (Contiguous Memory): Copy nguyên một block bộ nhớ liền kề được CPU cache prefetcher nhận diện và nạp sẵn vào L1/L2 cache cực nhanh.
Thân thiện với GC (GC-Friendly): Hoàn toàn không sinh ra các node object mới (không tạo rác), giảm tải tối đa cho Garbage Collector.
Cache Locality: Giữ cho CPU pipeline hoạt động liên tục mà không bị nghẽn do stall bộ nhớ.

Pitfall `ArrayList`

Tốn memory khi remove nhiều: size giảm nhưng elementData.length không shrink. Phải gọi trimToSize() thủ công để giải phóng.
Resize 1.5x có thể waste ~33% memory trung bình. new ArrayList<>(knownSize) giúp.

3. `LinkedList` — doubly-linked list, memory scatter

Cấu trúc bên dưới

public class LinkedList<E> {
    Node<E> first;   // head
    Node<E> last;    // tail
    int size;

    private static class Node<E> {
        E item;
        Node<E> next;
        Node<E> prev;
    }
}

Mỗi element wrap trong 1 Node với 3 field: value, next pointer, prev pointer.

Memory layout

Heap (dia chi ngau nhien, khong lien ke):
  Node A @ 0x1000: {item=A, next=0x3A00, prev=null}
  Node B @ 0x3A00: {item=B, next=0x7F00, prev=0x1000}
  Node C @ 0x7F00: {item=C, next=null,   prev=0x3A00}

Mỗi node cấp phát qua new — OS/JVM đặt ở địa chỉ bất kỳ có sẵn trong heap. Rải rác (scattered), không cạnh nhau.

Thêm: mỗi node có object header (12-16 byte trên 64-bit JVM) + 3 field × 8 byte = ~40 byte / element. So với ArrayList 8 byte / element. Overhead 5x memory.

`get(i)` — O(n)

Node<E> node(int index) {
    if (index < (size >> 1)) {
        Node<E> x = first;
        for (int i = 0; i < index; i++) x = x.next;   // Walk tu head
        return x;
    } else {
        Node<E> x = last;
        for (int i = size - 1; i > index; i--) x = x.prev;   // Walk tu tail
        return x;
    }
}

Phải duyệt linked list từ head (hoặc tail, tuỳ gần hơn) đến index. O(n/2) = O(n).

Cache nightmare: mỗi x.next fetch node ở địa chỉ khác nhau — CPU cache miss mỗi lần. 10k element = 10k cache miss × 100ns = 1 millisecond chỉ để duyệt list. ArrayList.get(9999) = 1 memory access = 100ns = 10000x nhanh hơn.

`add(e)` tail — O(1) thật

Tạo node mới, trỏ last.next → node mới, update last. O(1). Không như ArrayList không bao giờ cần resize/copy.

Nhưng: tạo object node mới — tốn memory allocation + GC pressure. Add 1M element = 1M node object mới = 40MB heap + GC work. ArrayList 1M = 1 array 8MB, không GC pressure.

`add(0, e)` head — O(1) thật

LinkedList add đầu list O(1) — chỉ update first.prev và tạo node mới. ArrayList add(0, e) phải shift toàn bộ array O(n).

Đây là tình huống duy nhất LinkedList thắng ArrayList thực tế. Nhưng cần queue/deque → ArrayDeque thắng cả hai.

Bảng so sánh

Operation	`ArrayList`	`LinkedList`	Thực tế
`get(i)`	O(1)	O(n)	ArrayList nhanh hơn 10-1000x
`add(e)` tail	O(1) amortized	O(1)	ArrayList nhanh hơn (không alloc node)
`add(0, e)` head	O(n)	O(1)	LinkedList thắng
`add(middle, e)`	O(n) memcpy	O(n) walk + O(1) link	ArrayList thường thắng
Iterate (for-each)	O(n) cache-hot	O(n) cache-miss	ArrayList ~10x nhanh hơn
Memory/element	~8 byte ref	~40 byte	ArrayList tiết kiệm 5x
GC friendliness	Tốt (1 array)	Tệ (N node nhỏ)	ArrayList

Josh Bloch (tác giả Collections framework) từng tự nhận rằng chính ông viết LinkedList nhưng chưa bao giờ dùng nó — nguyên văn: "Does anyone actually use LinkedList? I wrote it, and I never use it".

Kết luận

ArrayList — mặc định 99% trường hợp.
LinkedList — gần như không nên dùng. Cần queue/deque → ArrayDeque.

4. `ArrayDeque` — circular buffer

Cấu trúc

public class ArrayDeque<E> {
    Object[] elements;   // circular array
    int head;            // index element dau
    int tail;            // index slot trong tiep theo
}

Array với 2 pointer head/tail di chuyển vòng tròn (circular). Add/remove 2 đầu chỉ di chuyển pointer — O(1) không cần shift.

Memory layout

elements: [ ][ ][C][D][E][A][B][ ]
                 tail=2   head=5
               (wrap around)

Head = 5, tail = 2 (wrap around). Element theo thứ tự: A (5), B (6), [wrap], C (0), D (1), E (2).

Add tail: elements[tail] = e; tail = (tail + 1) % length; — O(1). Add head: head = (head - 1 + length) % length; elements[head] = e; — O(1).

Bảng so sánh stack/queue

	`Stack` (legacy)	`LinkedList`	`ArrayDeque`
Push/pop	O(1)	O(1)	O(1)
Memory	Array	Node + 40 byte/el	Array
Cache	Tốt	Kém	Tốt
Thread-safe	✅ (synchronized)	❌	❌
Performance	Chậm (sync overhead)	Chậm (GC)	Nhanh nhất

Rule: cần stack/queue không concurrent → ArrayDeque luôn thắng. Stack class Java legacy (Java 1.0) — không dùng vì synchronized bất cứ thứ gì không cần thiết.

Dùng làm stack

Deque<Integer> stack = new ArrayDeque<>();
stack.push(1);
stack.push(2);
stack.push(3);
stack.pop();   // 3 (LIFO)

Dùng làm queue

Queue<Integer> queue = new ArrayDeque<>();
queue.offer(1);
queue.offer(2);
queue.poll();   // 1 (FIFO)

5. `PriorityQueue` — binary heap

Cấu trúc

Binary heap thực tế được biểu diễn và lưu trữ phẳng trong một array tuần tự. Để tìm mối quan hệ cha-con giữa các node, ta không cần dùng con trỏ pointer phức tạp mà tính toán trực tiếp bằng chỉ số index:

Node cha ở vị trí index i sẽ có:
- Node con trái (Left Child) tại index: 2i + 1
- Node con phải (Right Child) tại index: 2i + 2
Ngược lại, một node con bất kỳ ở index c luôn tìm được node cha của nó tại index: (c - 1) / 2 (phép chia số nguyên tự động làm tròn xuống).

Dưới đây là sơ đồ ASCII minh họa mối liên kết cha-con tương ứng với mảng heap [1, 3, 2, 5, 4, 7, 6]:

Mảng lưu trữ heap nhị phân (Binary Heap Array):
+-------+-------+-------+-------+-------+-------+-------+
|   1   |   3   |   2   |   5   |   4   |   7   |   6   |
+-------+-------+-------+-------+-------+-------+-------+
 Index 0 Index 1 Index 2 Index 3 Index 4 Index 5 Index 6


Sơ đồ cây nhị phân ASCII tương ứng (Visualizing Index & Parent-Child Relations):

                         Index 0
                         [  1  ] (Root)
                       /         \
             Index 1                 Index 2
             [  3  ]                 [  2  ]
            /       \               /       \
       Index 3     Index 4     Index 5     Index 6
       [  5  ]     [  4  ]     [  7  ]     [  6  ]

Mối quan hệ cha-con từ trực quan đến toán học:

Node giá trị 3 ở Index i = 1:
- Con trái: 2 * 1 + 1 = 3 -> Trỏ tới Index 3 (giá trị 5).
- Con phải: 2 * 1 + 2 = 4 -> Trỏ tới Index 4 (giá trị 4).
- Cha của nó: (1 - 1) / 2 = 0 -> Trỏ tới Index 0 (giá trị 1).
Node giá trị 7 ở Index c = 5:
- Cha của nó: (5 - 1) / 2 = 2 -> Trỏ tới Index 2 (giá trị 2).

Tính chất cốt lõi của Min-Heap: Giá trị của node cha luôn nhỏ hơn hoặc bằng giá trị của các node con (array[parent] <= array[child]), đảm bảo phần tử nhỏ nhất luôn nằm ở Root (array[0]).

Operation

peek() — root = array[0]. O(1).
offer(e) — thêm vào array[size], sau đó sift-up: so với parent, swap nếu cần. O(log n).
poll() — lấy root, swap root với last element, giảm size, sift-down: so với smaller child, swap nếu cần. O(log n).

Use case

Top-K: maintain heap size k, push mọi element, pop khi vượt k.
Dijkstra: lấy node chưa visit có distance nhỏ nhất.
Scheduling: task có priority, luôn lấy task priority cao nhất.
Merge K sorted list: push head mỗi list, pop min, push next.

Mặc định min-heap. Max-heap: pass Comparator.reverseOrder().

6. Pitfall tổng hợp

❌ Nhầm 1: Dùng LinkedList vì "đọc trên internet nói insert nhanh".

LinkedList<Integer> list = new LinkedList<>();
for (int i = 0; i < 10_000; i++) list.add(i);
for (int i = 0; i < list.size(); i++) sum += list.get(i);   // O(n^2) nightmare

✅ ArrayList 99% trường hợp.

❌ Nhầm 2: Stack legacy thay ArrayDeque.

Stack<Integer> stack = new Stack<>();   // Synchronized, cham, extends Vector

✅ Deque<Integer> stack = new ArrayDeque<>();

❌ Nhầm 3: Thêm/remove ArrayList ở đầu liên tục.

for (int i = 0; i < 100_000; i++) list.add(0, i);   // O(n^2)

✅ ArrayDeque cho add đầu O(1).

❌ Nhầm 4: Modify collection đang iterate → ConcurrentModificationException.

for (String s : list) { if (bad(s)) list.remove(s); }

✅ list.removeIf(...) hoặc Iterator.remove().

7. 📚 Deep Dive Oracle

📚 Deep Dive Oracle

Spec / reference chính thức:

ArrayList javadoc — grow factor, trimToSize.
LinkedList javadoc — doubly-linked list design.
ArrayDeque javadoc — circular buffer.
PriorityQueue javadoc — binary heap.
Effective Java Item 64 "prefer interfaces to implementations".

Ghi chú: Đọc source OpenJDK cho ArrayList là bài tập đáng thời gian — comment giải thích design choice (vì sao DEFAULT_CAPACITY 10, vì sao grow 1.5x không 2x như HashMap). Performance difference giữa ArrayList/LinkedList chủ yếu do cache — đây là bài học kinh điển khi thiết kế data structure trên CPU modern.

Liên kết khoá học khác

Khoá Thuật toán — bài 2.1 Array vs ArrayList — primitive array vs ArrayList performance, kích thước memory và khi nào chọn loại nào.
Khoá Thuật toán — bài 1.7 Case Study ArrayList.grow() — case study sâu về ArrayList.grow() tăng 1.5x trong OpenJDK source.
Khoá Thuật toán — bài 2.2 Linked List — vì sao LinkedList chậm hơn ArrayList dù cùng O(1) insert (cache locality và memory scatter).

8. Tóm tắt

ArrayList: contiguous array, cache-friendly, O(1) get, O(1) amortized add tail. Mặc định 99%.
LinkedList: doubly-linked node scatter, O(n) get với cache miss dày. Gần như không nên dùng.
ArrayDeque: circular buffer, O(1) 2 đầu, best cho stack/queue/deque.
PriorityQueue: binary heap array, O(log n) offer/poll, O(1) peek.
Big-O không nói hết — cache locality + allocation pattern quyết định thực tế.
ArrayList thường thắng LinkedList cả ở case Big-O ngang bằng — vì memcpy liền kề + không GC pressure.
ArrayDeque thay Stack legacy (synchronized vô ích) và LinkedList cho queue/deque.

9. Tự kiểm tra

Tự kiểm tra

Vì sao iterate LinkedList 1 triệu element chậm hơn iterate ArrayList cùng size hàng chục lần, dù cả hai Big-O là O(n)?

▸

Big-O tính số operation, không tính chi phí mỗi operation. Cả hai duyệt n element (O(n)), nhưng chi phí mỗi step khác nhau:

ArrayList: element trong array liền kề. CPU cache load 1 cache line (~64 byte = 8 reference). Iterate 8 element dùng 1 memory access + 7 cache hit. Mỗi step ~1ns.
LinkedList: mỗi element là node object rải rác heap. node.next trỏ đến địa chỉ random → CPU cache miss mỗi step → đọc main memory ~100ns mỗi access.

Tỉ lệ: 100ns / 1ns = 100x per element. Với 1M element → ArrayList ~1ms, LinkedList ~100ms.

Bonus: LinkedList mỗi node ~40 byte vs ArrayList 8 byte/ref → tốn 5x memory → GC nặng hơn.

Bài học: cache locality là yếu tố performance quan trọng mà Big-O không bắt được. Code modern ưu tiên data layout liền kề, tránh pointer chasing.

Vì sao ArrayDeque thường nhanh hơn LinkedList cho stack/queue, dù cả hai đều O(1)?

▸

3 lý do kỹ thuật:

Memory layout: ArrayDeque dùng array liền kề (circular buffer). LinkedList mỗi element là node object rải rác heap.
Cache locality: iterate/peek ArrayDeque → cache hit. LinkedList → cache miss mỗi next.
Allocation: ArrayDeque chỉ alloc array 1 lần (resize khi đầy). LinkedList alloc 1 node mỗi add — GC pressure. 1M push = 1M node object = 40MB garbage.

Benchmark điển hình (1M push/pop):

ArrayDeque: ~10ms.
LinkedList: ~50-100ms (tuỳ GC).
Stack legacy: ~150ms (synchronized overhead).

Quy tắc modern Java: cần stack/queue không thread-safe → ArrayDeque. Stack class extends Vector, synchronized mọi method vô ích — không dùng.

Đoạn sau tính total chậm thế nào với LinkedList 10k element?

LinkedList<Integer> list = new LinkedList<>();
for (int i = 0; i < 10_000; i++) list.add(i);

long sum = 0;
for (int i = 0; i < list.size(); i++) {
  sum += list.get(i);
}

▸

LinkedList.get(i) là O(n) — phải duyệt từ đầu đến index i. Loop chạy n lần × O(n) mỗi get = O(n²).

Với n = 10k → ~50 triệu operation. Chậm vài giây. Với n = 1M → 500 tỉ → treo.

Fix:

Đổi sang ArrayList — get(i) O(1), loop O(n).
Dùng for-each: for (int x : list) sum += x; — iterator next() O(1), tổng O(n) kể cả LinkedList.

Bài học: biết Big-O từng operation của implementation bạn dùng.

Khi nào dùng PriorityQueue? Cho ví dụ.

▸

PriorityQueue = binary heap. offer/poll O(log n), peek O(1). Dùng khi cần lấy element "nhỏ nhất" (hoặc lớn nhất) lặp đi lặp lại.

Ví dụ thực tế:

Top-K: tìm 10 request chậm nhất trong 1 giờ. Duy trì PQ size 10, offer mỗi request, poll nếu size vượt 10 → cuối cùng 10 request lớn nhất.
Task scheduling: worker lấy task priority cao nhất. PriorityQueue<Task> với Comparator theo priority.
Dijkstra shortest path: lấy node chưa visit có distance min.
Merge K sorted list: push head mỗi list, pop min, push next từ cùng list.

Khác TreeSet: PriorityQueue chỉ truy cập root O(1), không iterate sorted. TreeSet cho iterate sorted nhưng slower insert.

Vì sao ArrayList grow 1.5x mỗi lần resize thay vì 2x, và khi nào nên khởi tạo capacity trước?

▸

Hai lý do chính:

Tái sử dụng bộ nhớ: với hệ số 2x, mảng mới luôn lớn hơn tổng tất cả mảng cũ đã giải phóng (2ⁿ so với 2ⁿ − 1) → allocator không bao giờ tái dùng được vùng trống cũ, gây phân mảnh heap. Với 1.5x — nhỏ hơn tỷ lệ vàng φ ≈ 1.618 — chỉ sau vài lần resize, tổng vùng đã giải phóng đủ chứa mảng mới → tái sử dụng được.
Lãng phí ít hơn: ngay sau resize, hệ số 2x có thể thừa tới 50% slot trống; 1.5x chỉ thừa tối đa ~33% — đổi lại resize diễn ra thường xuyên hơn một chút, nhưng chi phí add vẫn giữ O(1) amortized.

Nên khởi tạo new ArrayList<>(expectedSize) khi biết trước số phần tử (batch load, đọc file, copy collection) — triệt tiêu toàn bộ chu kỳ resize + copy, nhanh hơn rõ rệt với list lớn.

Bài tiếp theo: Map và Set — HashMap, TreeMap, HashSet

Bài này có giúp bạn hiểu bản chất không?

Hỏi đáp về bài này

Chưa có câu hỏi

Đặt câu hỏi

Có gì chưa rõ trong bài? Đặt câu hỏi đầu tiên — câu trả lời từ cộng đồng giúp bạn (và người sau).

Đặt câu hỏi đầu tiên

← Bài trước

Wildcard `? extends`, `? super` — PECS rule

Bài tiếp

Map và Set — HashMap, TreeMap, HashSet bên dưới

List và Queue — ArrayList, LinkedList, ArrayDeque, PriorityQueue

1. Cây interface — bức tranh tổng

2. ArrayList — contiguous array, cache-friendly

Cấu trúc bên dưới

Memory layout

get(i) — O(1) đúng nghĩa

add(e) tail — O(1) amortized

💎 Vì sao hệ số tăng là 1.5x (ArrayList) mà không phải 2x (Vector, HashMap)?

add(i, e) giữa — O(n) nhưng nhanh thực tế

⚡ Sức mạnh từ JVM Intrinsic: Tại sao System.arraycopy lại nhanh kinh ngạc?

Pitfall ArrayList

3. LinkedList — doubly-linked list, memory scatter

Cấu trúc bên dưới

Memory layout

get(i) — O(n)

add(e) tail — O(1) thật

add(0, e) head — O(1) thật

Bảng so sánh

Kết luận

4. ArrayDeque — circular buffer

Cấu trúc

Memory layout

Bảng so sánh stack/queue

Dùng làm stack

Dùng làm queue

5. PriorityQueue — binary heap

Cấu trúc

Operation

Use case

6. Pitfall tổng hợp

7. 📚 Deep Dive Oracle

Liên kết khoá học khác

8. Tóm tắt

9. Tự kiểm tra

Chưa có câu hỏi

2. `ArrayList` — contiguous array, cache-friendly

`get(i)` — O(1) đúng nghĩa

`add(e)` tail — O(1) amortized

💎 Vì sao hệ số tăng là 1.5x (`ArrayList`) mà không phải 2x (`Vector`, `HashMap`)?

`add(i, e)` giữa — O(n) nhưng nhanh thực tế

⚡ Sức mạnh từ JVM Intrinsic: Tại sao `System.arraycopy` lại nhanh kinh ngạc?

Pitfall `ArrayList`

3. `LinkedList` — doubly-linked list, memory scatter

`get(i)` — O(n)

`add(e)` tail — O(1) thật

`add(0, e)` head — O(1) thật

4. `ArrayDeque` — circular buffer

5. `PriorityQueue` — binary heap