Q: "Vì sao 1D knapsack phải duyệt w từ W xuống weight[i]

Trong 1D optimization, mảng 'dp[]' được cập nhật tại chỗ (in-place). Khi xét item i, ta muốn 'dp[w - weight[i]]' vẫn là giá trị từ trạng thái trước khi xét item i (tức là hàng i-1 trong bảng 2D). Nếu duyệt từ 0 lên, khi tính 'dp[w]' với w lớn, 'dp[w - weight[i]]' đã bị ghi đè trong vòng lặp hiện tại (vì 'w - weight[i] và đã được xử lý trước). Điều này cho phép item i được "lấy" ở 'dp[w - weight[i]]' lần nữa khi xét 'dp[w]' — tương đương lấy item i hai lần, vi phạm ràng buộc 0/1. Duyệt từ W xuống đảm bảo khi tính 'dp[w]' , mọi giá trị 'dp[ chưa bị chạm trong vòng lặp item i này — an toàn.

Q: Unbounded knapsack khác 0/1 knapsack ở điểm nào trong implementation? Cho coin change là ví dụ.

Điểm khác biệt duy nhất về implementation: hướng duyệt w trong vòng lặp inner. 0/1 knapsack: 'for w — ngăn item được dùng nhiều lần. Unbounded: 'for w — cho phép item được dùng nhiều lần (vì 'dp[w - weight[i]]' đã phản ánh việc dùng item đó trước đó trong vòng lặp hiện tại). Coin change với coins = [1, 5, 10], amount = W: 'dp[w] = min(dp[w], 1 + dp[w - coin[i]])' , duyệt w từ 1 lên W. Dùng mỗi coin nhiều lần không giới hạn — đúng bản chất unbounded. Thay max bằng min, thay value bằng 1 (đếm số đồng).

Q: Bảng trace dp[i][w] của ví dụ 4 items W=5 — kiểm tra dp[3][4] = 11 bằng tay.

Tại 'dp[3][4]' , ta xét item 3 (weight=3, value=10) với sức chứa w=4. Nhánh không lấy: 'dp[2][4] = 7' (lấy item 1+2: 1+6=7, weight 1+2=3 <= 4). Nhánh lấy item 3: 'value[3] + dp[2][4-3] = 10 + dp[2][1] = 10 + 1 = 11' (dp[2][1] = 1 vì chỉ lấy được item 1 với sức chứa 1). Max(7, 11) = 11. Đúng như bảng. Ý nghĩa: kết hợp tốt nhất khi xét 3 items đầu, sức chứa 4 là lấy item 3 (w=3,v=10) + item 1 (w=1,v=1) = weight 4, value 11.

Q: 0/1 Knapsack là NP-Complete — vậy DP O(n×W) có mâu thuẫn không? Pseudo-polynomial nghĩa là gì?

Không mâu thuẫn. DP O(n×W) là pseudo-polynomial : polynomial theo giá trị số W, nhưng W không phải kích thước input thực. Kích thước input thực của W là số bit cần để biểu diễn nó, tức log₂(W). Nếu W = 2^30 (khoảng 1 tỷ), mảng dp cần 1 tỷ phần tử — không khả thi dù O(n×W) "trông" polynomial. Với n = 100 items, W = 2^30, time thực tế là 100 × 10^9 = 100 tỷ operations. NP-Complete phát biểu: không có thuật toán polynomial theo kích thước input bit. Pseudo-polynomial vẫn bị "tấn công" khi W lớn — đó là lý do bài toán knapsack thực tế dùng FPTAS (xấp xỉ) hoặc DP theo value khi W quá lớn.

Q: "Nếu muốn reconstruct tập items được chọn (không chỉ giá trị tối đa)

Cần giữ bảng 2D đầy đủ và trace ngược từ 'dp[n][W]' về 'dp[0][0]' . Reconstruction: bắt đầu tại 'i=n, w=W' . Nếu 'dp[i][w] != dp[i-1][w]' thì item i đã được lấy — ghi nhận item i, giảm w xuống 'w - weight[i]' , giảm i về i-1. Nếu bằng nhau, item i không được lấy — chỉ giảm i về i-1. Lặp cho đến khi i=0 hoặc w=0. Với bản 1D, không thể reconstruct trực tiếp (thông tin hàng trước bị xóa). Phải dùng bảng 2D O(n×W) space, hoặc lưu riêng mảng boolean 'taken[i][w]' để đánh dấu khi nào "lấy" item i thắng nhánh "không lấy".

Question 1

Tại sao 0/1 Knapsack dùng DP chứ không dùng greedy (chọn theo value/weight ratio)? Cho counter-example cụ thể với W = 6.

Accepted Answer

Greedy chọn item tốt nhất tức thì mà không xem xét kết hợp toàn cục. Với 0/1 knapsack, item được chọn chiếm không gian cố định và không thể hoàn trả — nên chọn sai ở bước đầu có thể chặn kết hợp tốt hơn ở bước sau.

Counter-example W = 6: items A (weight=4, value=8, ratio=2.0), B (weight=3, value=5, ratio=1.67), C (weight=3, value=5, ratio=1.67). Greedy chọn A (ratio cao nhất), còn 2 kg — B và C không vào. Value = 8. DP chọn B + C (3+3=6=W), value = 10. Greedy kém hơn DP 25%.

DP đúng vì nó xét mọi kết hợp qua subproblem dp[i][w] — mỗi trạng thái lưu giá trị tốt nhất cho sức chứa w khi xét i items đầu, đảm bảo không bỏ sót kết hợp nào.

Question 2

Giải thích recurrence dp[i][w] = max(dp[i-1][w], value[i] + dp[i-1][w - weight[i]]). Hai nhánh nghĩa là gì?

Accepted Answer

Recurrence thể hiện quyết định nhị phân tại mỗi bước: với item thứ i và sức chứa còn lại w, ta có đúng hai lựa chọn.

Nhánh 1: không lấy item i — dp[i-1][w]. Giá trị tốt nhất với sức chứa w chỉ dùng i-1 items trước đó, item i bị bỏ qua.

Nhánh 2: lấy item i — value[i] + dp[i-1][w - weight[i]]. Lấy item i đóng góp value[i], và sức chứa còn lại cho i-1 items trước là w - weight[i]. Chỉ khả thi khi weight[i] <= w. Chọn max giữa hai nhánh cho kết quả tối ưu tại trạng thái đó.

Question 3

"Vì sao 1D knapsack phải duyệt w từ W xuống weight[i]

Accepted Answer

Trong 1D optimization, mảng 'dp[]' được cập nhật tại chỗ (in-place). Khi xét item i, ta muốn 'dp[w - weight[i]]' vẫn là giá trị từ trạng thái trước khi xét item i (tức là hàng i-1 trong bảng 2D). Nếu duyệt từ 0 lên, khi tính 'dp[w]' với w lớn, 'dp[w - weight[i]]' đã bị ghi đè trong vòng lặp hiện tại (vì 'w - weight[i] và đã được xử lý trước). Điều này cho phép item i được "lấy" ở 'dp[w - weight[i]]' lần nữa khi xét 'dp[w]' — tương đương lấy item i hai lần, vi phạm ràng buộc 0/1. Duyệt từ W xuống đảm bảo khi tính 'dp[w]' , mọi giá trị 'dp[ chưa bị chạm trong vòng lặp item i này — an toàn.

Question 4

Unbounded knapsack khác 0/1 knapsack ở điểm nào trong implementation? Cho coin change là ví dụ.

Accepted Answer

Điểm khác biệt duy nhất về implementation: hướng duyệt w trong vòng lặp inner.

0/1 knapsack: for w <- W xuống weight[i] — ngăn item được dùng nhiều lần. Unbounded: for w <- weight[i] lên W — cho phép item được dùng nhiều lần (vì dp[w - weight[i]] đã phản ánh việc dùng item đó trước đó trong vòng lặp hiện tại).

Coin change với coins = [1, 5, 10], amount = W: dp[w] = min(dp[w], 1 + dp[w - coin[i]]), duyệt w từ 1 lên W. Dùng mỗi coin nhiều lần không giới hạn — đúng bản chất unbounded. Thay max bằng min, thay value bằng 1 (đếm số đồng).

Question 5

Bảng trace dp[i][w] của ví dụ 4 items W=5 — kiểm tra dp[3][4] = 11 bằng tay.

Accepted Answer

Tại 'dp[3][4]' , ta xét item 3 (weight=3, value=10) với sức chứa w=4. Nhánh không lấy: 'dp[2][4] = 7' (lấy item 1+2: 1+6=7, weight 1+2=3 <= 4). Nhánh lấy item 3: 'value[3] + dp[2][4-3] = 10 + dp[2][1] = 10 + 1 = 11' (dp[2][1] = 1 vì chỉ lấy được item 1 với sức chứa 1). Max(7, 11) = 11. Đúng như bảng. Ý nghĩa: kết hợp tốt nhất khi xét 3 items đầu, sức chứa 4 là lấy item 3 (w=3,v=10) + item 1 (w=1,v=1) = weight 4, value 11.

Question 6

0/1 Knapsack là NP-Complete — vậy DP O(n×W) có mâu thuẫn không? Pseudo-polynomial nghĩa là gì?

Accepted Answer

Không mâu thuẫn. DP O(n×W) là pseudo-polynomial : polynomial theo giá trị số W, nhưng W không phải kích thước input thực. Kích thước input thực của W là số bit cần để biểu diễn nó, tức log₂(W). Nếu W = 2^30 (khoảng 1 tỷ), mảng dp cần 1 tỷ phần tử — không khả thi dù O(n×W) "trông" polynomial. Với n = 100 items, W = 2^30, time thực tế là 100 × 10^9 = 100 tỷ operations. NP-Complete phát biểu: không có thuật toán polynomial theo kích thước input bit. Pseudo-polynomial vẫn bị "tấn công" khi W lớn — đó là lý do bài toán knapsack thực tế dùng FPTAS (xấp xỉ) hoặc DP theo value khi W quá lớn.

Question 7

"Nếu muốn reconstruct tập items được chọn (không chỉ giá trị tối đa)

Accepted Answer

Cần giữ bảng 2D đầy đủ và trace ngược từ dp[n][W] về dp[0][0].

Reconstruction: bắt đầu tại i=n, w=W. Nếu dp[i][w] != dp[i-1][w] thì item i đã được lấy — ghi nhận item i, giảm w xuống w - weight[i], giảm i về i-1. Nếu bằng nhau, item i không được lấy — chỉ giảm i về i-1. Lặp cho đến khi i=0 hoặc w=0.

Với bản 1D, không thể reconstruct trực tiếp (thông tin hàng trước bị xóa). Phải dùng bảng 2D O(n×W) space, hoặc lưu riêng mảng boolean taken[i][w] để đánh dấu khi nào "lấy" item i thắng nhánh "không lấy".

Đặc trưng	Packer tham lam	Packer DP
Chiến lược	Chọn item tốt nhất tức thì	Xét mọi kết hợp qua subproblem
Đảm bảo tối ưu	Không (sai với 0/1)	Có
Độ phức tạp	O(n log n)	O(n × W)
Phù hợp khi nào	Fractional knapsack (chia được)	0/1 và unbounded

Bài toán cái túi — 0/1 Knapsack, Unbounded và tối ưu không gian

1. Analogy — Packer thông minh so với packer tham lam

2. Phát biểu bài toán và ký hiệu

3. Cơ chế — DP 2D cho 0/1 Knapsack

3.1 Định nghĩa subproblem

3.2 Trace ví dụ — 4 items, W = 5

4. Tối ưu không gian — 2D xuống 1D

5. Greedy sai — counter-example

6. Unbounded Knapsack

7. Liên hệ các bài khác

8. Deep Dive

9. Tóm tắt

10. Tự kiểm tra

Chưa có câu hỏi

Item	weight	value	value/weight
A	6	12	2.0 (tốt nhất)
B	5	10	2.0 (tốt nhất)
C	5	10	2.0 (tốt nhất)