Nội dung
Danh sách bài học
- 01~19 phút
Vòng đời dữ liệu — từ ingest đến archive
Một bản ghi log sống qua bốn giai đoạn: nhập, lưu, phục vụ, lưu trữ dài hạn. Mỗi tầng có một quyết định cost vs freshness — agnostic, không gắn engine.
- 02~20 phút
Encoding & serialization — text vs binary
Object trong RAM không ghi thẳng xuống đĩa hay gửi qua mạng được. Vì sao cần encode, và đánh đổi text (JSON) dễ đọc vs binary (Avro/Protobuf) gọn nhanh.
- 03~20 phút
Schema evolution — đổi schema không downtime
Dữ liệu sống lâu hơn code. Schema phải đổi mà không vỡ data cũ hay client cũ — backward/forward compatibility và expand-contract migration, agnostic.