Q: Fibonacci tối ưu xuống O(1) space được vì sao? Bài toán nào KHÔNG thể tối ưu space theo cách này?

Fibonacci tối ưu space được vì transition 'dp[i] = dp[i-1] + dp[i-2]' chỉ phụ thuộc 2 state liền trước — không cần giữ toàn bộ mảng. Chỉ cần 2 biến 'prev1' và 'prev2' , cập nhật theo từng bước. Bài toán KHÔNG thể tối ưu tương tự: Edit Distance hay LCS với bảng 2D 'dp[i][j]' . Transition phụ thuộc cả hàng trên ( 'dp[i-1][j]' , 'dp[i-1][j-1]' ) và cột trái ( 'dp[i][j-1]' ). Có thể giảm từ O(mn) xuống O(n) bằng cách chỉ giữ 2 hàng (hàng hiện tại và hàng trên), nhưng không thể xuống O(1) vì vẫn cần toàn bộ hàng trước đó. Ngoài ra, nếu cần reconstruct path (truy vết), không thể tối ưu space — phải giữ toàn bộ bảng để trace back.

Question 1

Hai điều kiện để một bài toán có thể giải bằng DP là gì? Cho ví dụ bài toán THIẾU một trong hai điều kiện.

Accepted Answer

Hai điều kiện: (1) Overlapping subproblems — cùng subproblem nhỏ xuất hiện nhiều lần khi giải bài lớn. (2) Optimal substructure — solution tối ưu của bài lớn được xây từ solution tối ưu của subproblem. Thiếu overlapping subproblems: merge sort chia mảng thành hai nửa không giao nhau — mỗi subproblem chỉ xuất hiện một lần, không có gì để cache. Dùng divide and conquer, không phải DP. Thiếu optimal substructure: longest simple path (đường dài nhất không lặp đỉnh). Path dài nhất từ A đến C không thể xây từ path dài nhất từ A đến B và từ B đến C — vì hai path đó có thể dùng chung đỉnh, vi phạm điều kiện "simple". Bài toán này là NP-hard, không giải được bằng DP polynomial.

Question 2

Memoization khác tabulation như thế nào? Khi nào bạn chọn cái nào?

Accepted Answer

Memoization (top-down): giữ cấu trúc đệ quy, thêm cache trước mỗi lần tính. Tính lazy — chỉ tính subproblem thực sự được gọi đến. Code gần với công thức toán hơn, dễ verify. Nhược điểm: stack overflow khi n lớn (mỗi call thêm một frame vào call stack). Tabulation (bottom-up): vòng lặp điền mảng từ base case lên. Tính eager — tính tất cả subproblem theo thứ tự. Không có stack overflow risk. Dễ tối ưu space vì biết rõ cần giữ state nào. Chọn memoization khi mới thiết kế — dễ code và debug. Chuyển sang tabulation khi cần tối ưu space (chỉ giữ vài state gần), hoặc khi đệ quy quá sâu (n lên đến hàng triệu).

Question 3

"Tại sao Fibonacci naive có complexity O(2^n)? Sau khi thêm memo

Accepted Answer

Naive: mỗi lần gọi 'fib(n)' tạo ra 2 lần gọi con ( 'fib(n-1)' và 'fib(n-2)' ), mỗi lần gọi đó lại tạo ra 2 lần gọi nữa — cây nhị phân có chiều sâu n, số node là O(2^n). 'fib(3)' được tính ít nhất 2 lần, 'fib(2)' ít nhất 3 lần, số lần tăng theo cấp số nhân. Với memo: mỗi giá trị 'fib(k)' chỉ được tính đúng một lần — lần đầu tiên 'fib(k)' được gọi, kết quả được lưu vào 'memo[k]' . Mọi lần gọi tiếp theo trả về 'memo[k]' trong O(1). Có n giá trị phân biệt từ 0 đến n, mỗi giá trị tính đúng 1 lần — tổng n lần tính thực sự, complexity O(n).

Question 4

"Trong quy trình 5 bước

Accepted Answer

State là nền tảng của toàn bộ solution DP. Nếu state sai hoặc thiếu thông tin, transition sẽ không đúng, base case không rõ, và kết quả cuối cùng sai — dù code hoàn toàn đúng về mặt syntax.

State cần có tính Markov: đủ thông tin để xác định kết quả của subproblem mà không cần biết lịch sử đã đến state này như thế nào. Ví dụ: nếu bài toán grid có thêm ràng buộc "đã dùng k bước đặc biệt", thì state (i, j) không đủ — phải dùng (i, j, k). Thiếu k, hai tình huống khác nhau sẽ bị merge vào cùng một cell dp, dẫn đến kết quả sai.

Nguyên tắc: thêm state cho đến khi "biết state là biết tất cả". Bắt đầu với state đơn giản nhất, nếu không đủ thì thêm chiều.

Question 5

Fibonacci tối ưu xuống O(1) space được vì sao? Bài toán nào KHÔNG thể tối ưu space theo cách này?

Accepted Answer

Fibonacci tối ưu space được vì transition dp[i] = dp[i-1] + dp[i-2] chỉ phụ thuộc 2 state liền trước — không cần giữ toàn bộ mảng. Chỉ cần 2 biến prev1 và prev2, cập nhật theo từng bước.

Bài toán KHÔNG thể tối ưu tương tự: Edit Distance hay LCS với bảng 2D dp[i][j]. Transition phụ thuộc cả hàng trên (dp[i-1][j], dp[i-1][j-1]) và cột trái (dp[i][j-1]). Có thể giảm từ O(mn) xuống O(n) bằng cách chỉ giữ 2 hàng (hàng hiện tại và hàng trên), nhưng không thể xuống O(1) vì vẫn cần toàn bộ hàng trước đó.

Ngoài ra, nếu cần reconstruct path (truy vết), không thể tối ưu space — phải giữ toàn bộ bảng để trace back.

Question 6

"Greedy vs DP — cả hai đều có optimal substructure. Làm sao phân biệt khi nào dùng greedy

Accepted Answer

Greedy cũng cần optimal substructure — nhưng thêm một điều kiện mạnh hơn: greedy choice property — lựa chọn tham lam cục bộ (locally optimal) luôn dẫn đến solution tối ưu toàn cục, không cần xét lại. Không cần cân nhắc nhiều lựa chọn.

DP cần cân nhắc nhiều lựa chọn tại mỗi state và lấy kết quả tốt nhất — vì lựa chọn cục bộ tốt nhất chưa chắc là tốt nhất toàn cục. Ví dụ coin change với đồng xu 1, 3, 4 và cần đổi 6: greedy chọn 4 trước → còn 2, chọn 1+1 = tổng 3 đồng. DP tìm được 3+3 = 2 đồng. Greedy sai.

Heuristic phân biệt: thử greedy trước — nếu có thể chứng minh greedy choice property (thường qua exchange argument), dùng greedy. Nếu không chứng minh được hoặc có counter-example, dùng DP.

Question 7

Vẽ lại cây đệ quy của fib(4) với naive và với memoization. Số lần tính fib(2) là bao nhiêu trong mỗi trường hợp?

Accepted Answer

Naive fib(4): 'fib(4) → fib(3) + fib(2)' 'fib(3) → fib(2) + fib(1)' 'fib(2) → fib(1) + fib(0)' (lần 1, từ fib(3)) 'fib(2) → fib(1) + fib(0)' (lần 2, trực tiếp từ fib(4)) Tổng: 'fib(2)' được tính 2 lần , 'fib(1)' được tính 3 lần. Với memoization: Lần đầu 'fib(2)' được tính (từ nhánh fib(3)), kết quả ghi vào 'memo[2]' . Khi 'fib(4)' cần 'fib(2)' lần hai, tra cache trả về ngay — không tính lại. Tổng: 'fib(2)' được tính thực sự 1 lần . Đây là toàn bộ sức mạnh của memoization.

Sổ tay	Dynamic Programming
Câu hỏi con	Subproblem
Đáp án trong sổ	Giá trị đã cache (`memo[]` hoặc `dp[]`)
Tra sổ thay vì tính lại	Overlapping subproblems được giải quyết
Câu hỏi lớn = tổ hợp câu nhỏ	Optimal substructure
Thứ tự điền sổ	Thứ tự tính dp (bottom-up)
Trang cuối = đáp án bài lớn	`dp[n]` = kết quả cần tìm

Tiêu chí	Memoization (top-down)	Tabulation (bottom-up)
Cấu trúc code	Đệ quy + cache	Vòng lặp + mảng
Thứ tự tính	Lazy — chỉ tính subproblem cần thiết	Eager — tính tất cả theo thứ tự
Stack overflow	Có nguy cơ khi n lớn	Không
Dễ code	Thường dễ hơn (giữ logic đệ quy)	Cần nghĩ thứ tự điền bảng
Tối ưu không gian	Khó (cache thường giữ tất cả)	Dễ — chỉ giữ vài state gần
Performance constant	Nhỏ hơn (function call overhead)	Nhỏ hơn (cache-friendly array)

Dynamic Programming — framework 5 bước để giải quyết bài toán tối ưu

1. Analogy — Sổ tay tính toán

2. Hai điều kiện của DP

2.1 Overlapping subproblems

2.2 Optimal substructure

3. Hai cách implement DP

3.1 Memoization — top-down

3.2 Tabulation — bottom-up

3.3 So sánh hai cách

4. Ví dụ đầy đủ — Fibonacci: từ O(2^n) xuống O(n)

4.1 Naive — O(2^n)

4.2 Sau khi thêm memo — O(n)

4.3 Tối ưu space xuống O(1)

5. Quy trình 5 bước thiết kế DP

Bước 1 — Xác định state

Bước 2 — Viết transition (recurrence relation)

Bước 3 — Base case

Bước 4 — Thứ tự tính (nếu dùng tabulation)

Bước 5 — Tối ưu không gian (tuỳ chọn)

6. Pitfall — Thiếu base case hoặc sai thứ tự

Pitfall 1 — Quên base case

Pitfall 2 — Sai thứ tự tính trong tabulation

Pitfall 3 — State không đủ thông tin

7. Liên hệ các bài khác

📚 Deep Dive

Tóm tắt

Tự kiểm tra

Chưa có câu hỏi