Bài 50 / 66~20 phútSearch engine algorithmsMiễn phí… lượt xem
Inverted index — nền tảng full-text search
Ánh xạ term → danh sách document chứa nó (posting list). Tokenize, normalize, và vì sao tra cứu nhanh hơn quét tuần tự.
🚧 Đang biên soạn
Bài học này đang được biên soạn — phần dưới là đề cương dự kiến để định hướng nội dung. Code sẽ dùng pseudocode tiếng Việt có dấu; mỗi bài concept có TL;DR + mermaid + self-check 5–7 câu.
Loại bài: Bài concept
Đề cương dự kiến
- Term → posting list
- Tokenize + normalize
- Posting list nén
- Liên hệ hash/trie (module 03)
⁂
Bài tiếp theo: TF-IDF — chấm điểm liên quan cổ điển
Bài này có giúp bạn hiểu bản chất không?
Hỏi đáp về bài này
Chưa có câu hỏi
Có gì chưa rõ trong bài? Đặt câu hỏi đầu tiên — câu trả lời từ cộng đồng giúp bạn (và người sau).
Đặt câu hỏi đầu tiên