Question 1

Vì sao không thể dùng wall-clock để xác định thứ tự sự kiện giữa hai node trong hệ phân tán? Cho ví dụ cụ thể.

Accepted Answer

Đồng hồ vật lý mỗi máy dùng thạch anh riêng và drift theo nhiệt độ, tải, phần cứng. NTP đồng bộ định kỳ nhưng vẫn để lại sai lệch 10–300 ms tùy điều kiện mạng. Nếu node A timestamp sự kiện lúc 10:00:00.200 và node B lúc 10:00:00.100, không thể kết luận B xảy ra trước — có thể đồng hồ B đang chạy nhanh hơn 150 ms.

Hệ quả: với drift 100 ms, hai write đến trong cùng 100 ms window đảo thứ tự tùy thuộc đồng hồ nào drift theo hướng nào. Wall-clock timestamp không phản ánh quan hệ nhân quả — chỉ phản ánh thời điểm mỗi máy tự đo, không có giá trị so sánh cross-machine tin cậy.

Question 2

Giải thích quy tắc element-wise max khi nhận message. Tại sao lấy max chứ không lấy giá trị của sender?

Accepted Answer

Khi node A nhận message từ node B kèm 'VC_B' , nghĩa là B đã "biết" tất cả sự kiện mà 'VC_B[j]' ghi nhận — bao gồm cả những sự kiện B nghe từ các node khác trước đó. Lấy 'VC[j] = max(VC[j], VC_msg[j])' đảm bảo A hấp thụ toàn bộ kiến thức nhân quả tích lũy của B. Nếu chỉ lấy giá trị sender, A sẽ xóa kiến thức mà A đã tự thu thập từ các source khác — mất thông tin. Ví dụ: A đã nhận message từ C trước đó nên 'VC_A[3]=5' , trong khi B chưa biết về C nên 'VC_B[3]=2' . Lấy max giữ lại 'VC_A[3]=5' đúng; copy sang sẽ làm mất 3 sự kiện C mà A đã biết.

Question 3

Cho hai vector clock: VC1 = [2, 3, 1] và VC2 = [3, 1, 2]. Quan hệ của chúng là gì? Ý nghĩa thực tế là gì?

Accepted Answer

So sánh element-wise: 'VC1[1]=2 (VC1 nhỏ hơn ở chiều 1), nhưng 'VC1[2]=3 > VC2[2]=1' (VC1 lớn hơn ở chiều 2). Vì không có chiều nào nhỏ hơn toàn phần, kết quả là concurrent . Ý nghĩa thực tế: hai sự kiện tương ứng không có quan hệ nhân quả với nhau. Node 1 đã làm thêm sự kiện nhưng chưa truyền sang node 2, trong khi node 2 đã làm thêm sự kiện nhưng chưa truyền sang node 1. Nếu đây là hai write vào cùng key, cả hai write đều hợp lệ và hệ thống phải giữ cả hai như sibling versions rồi để application quyết định merge.

Question 4

"Vector clock phát hiện concurrent khác gì so với Lamport scalar clock? Khi nào chọn Lamport

Accepted Answer

Lamport scalar clock đảm bảo: nếu 'A → B' thì 'clock(A) . Nhưng chiều ngược lại không đúng — 'clock(A) không suy ra 'A → B' . Khi hai sự kiện concurrent, scalar clock vẫn cho một thứ tự (ai nhỏ hơn đứng trước) nhưng thứ tự đó không có ý nghĩa nhân quả. Không thể biết "A thật sự xảy ra trước B" hay "A và B concurrent". Vector clock suy luận cả hai chiều: 'A → B' (strict happens-before) khi và chỉ khi 'VC_A ≤ VC_B' và 'VC_A ≠ VC_B' (tức tồn tại ít nhất một chiều mà VC_A strictly nhỏ hơn VC_B). Điều kiện 'VC_A ≤ VC_B' đơn thuần không đủ vì khi 'VC_A = VC_B' , hai event là cùng một event — không phải happens-before. Chọn Lamport khi chỉ cần total order đơn giản (distributed log ordering, Lamport mutex) với chi phí O(1). Chọn vector clock khi cần phân biệt happens-before và concurrent để phát hiện conflict — điển hình là eventual-consistency database như Dynamo/Riak.

Question 5

"Trong Dynamo

Accepted Answer

Vector clock trong Dynamo được gắn vào mỗi version của data để theo dõi lịch sử nhân quả. Khi client đọc version v (kèm VC_v), rồi tính toán và ghi lại version mới v', server cần biết v' kế thừa nhân quả từ v. Client gửi kèm VC_v làm "context" để server biết v → v'.

Nếu client gửi VC rỗng (hoặc không gửi context), server nhìn thấy write không có lịch sử nhân quả — trông như một write độc lập hoàn toàn. Khi hệ thống so sánh write này với version hiện tại, kết quả sẽ là "concurrent" dù thực tế không phải. Điều này tạo sibling giả: hai version được giữ lại trong khi chỉ cần một, làm tăng overhead ứng dụng phải xử lý merge cho những conflict không có thật.

Question 6

"Vector clock có n node

Accepted Answer

Với 1000 node, mỗi message phải đính kèm vector 1000 phần tử integer — overhead đáng kể. Trong thực tế Dynamo, số coordinator node tham gia vào một write thường nhỏ (3–5 node theo consistent hashing), nên vector chỉ cần theo dõi các node thật sự tham gia, không phải toàn cụm.

Giải pháp thực tế: (1) Pruning — Dynamo paper đề xuất xóa entry cũ nhất khi vector vượt ngưỡng kích thước, chấp nhận mất chút độ chính xác. (2) Dotted Version Vectors (Riak 2.0) — tách riêng vector của replica node với vector của client, giảm kích thước. (3) Interval Tree Clocks — không cần biết n cố định trước, hỗ trợ node join/leave động mà không cần resize vector.

Question 7

Tại sao Cassandra không dùng vector clock mà dùng last-write-wins (LWW) với timestamp? Đánh đổi là gì?

Accepted Answer

Cassandra chọn last-write-wins: khi có conflict, giữ version có timestamp lớn hơn (theo đồng hồ vật lý), bỏ version kia. Quyết định thiết kế này đơn giản hóa triệt để — không cần lưu vector, không cần application merge logic, conflict resolution O(1).

Đánh đổi: LWW bỏ thông tin nhân quả. Nếu đồng hồ hai node lệch nhau, write "mới hơn về nhân quả" có thể có timestamp nhỏ hơn và bị ghi đè bởi write cũ hơn — silent data loss. Đây là lý do Cassandra khuyến cáo dùng tính năng như lightweight transactions (Paxos) hoặc application-level idempotency khi cần strong consistency. Vector clock an toàn hơn nhưng đòi hỏi ứng dụng tự xử lý sibling — Cassandra đánh đổi correctness để lấy simplicity và throughput cao hơn.

VC_A	VC_B	Kết quả	Ý nghĩa
`[2, 1, 0]`	`[3, 2, 1]`	before	A xảy ra trước B nhân quả
`[3, 2, 1]`	`[2, 1, 0]`	after	B xảy ra trước A
`[2, 1, 0]`	`[1, 2, 0]`	concurrent	Không có thứ tự — có thể conflict
`[1, 2, 3]`	`[1, 2, 3]`	equal	Cùng trạng thái

Thuộc tính	Lamport scalar	Vector clock
`A → B` ⟹ `clock(A) < clock(B)`	Có	Có
`clock(A) < clock(B)` ⟹ `A → B`	KHÔNG	Có
Phát hiện concurrent	Không thể	Có (`compare` trả "concurrent")
Chi phí	O(1) per event	O(n) per event

Vector clock — thứ tự nhân quả sự kiện

1. Vấn đề: đồng hồ vật lý không đáng tin

2. Vector clock — cấu trúc và cập nhật

Quy tắc cập nhật

Trace 3 node, trao đổi message

3. So sánh hai vector clock — phát hiện concurrent

4. Ứng dụng: phát hiện conflict trong Dynamo/Riak

5. Pitfall

Pitfall 1 — Quên tăng VC[i] khi nhận message

Pitfall 2 — So sánh sai: dùng tổng thay vì element-wise

Pitfall 3 — Gắn VC của lúc đọc thay vì lúc ghi

6. Liên hệ các bài khác

📚 Deep Dive

Tóm tắt

Tự kiểm tra

Chưa có câu hỏi