Bài 51 / 66~18 phútSearch engine algorithmsMiễn phí… lượt xem
TF-IDF — chấm điểm liên quan cổ điển
Trọng số term theo tần suất trong document (TF) và độ hiếm toàn corpus (IDF). Vì sao term hiếm quan trọng hơn term phổ biến.
🚧 Đang biên soạn
Bài học này đang được biên soạn — phần dưới là đề cương dự kiến để định hướng nội dung. Code sẽ dùng pseudocode tiếng Việt có dấu; mỗi bài concept có TL;DR + mermaid + self-check 5–7 câu.
Loại bài: Bài concept
Đề cương dự kiến
- TF: tần suất term
- IDF: độ hiếm
- TF-IDF score
- Hạn chế (không bão hoà)
⁂
Bài tiếp theo: BM25 — chấm điểm chuẩn công nghiệp
Bài này có giúp bạn hiểu bản chất không?
Hỏi đáp về bài này
Chưa có câu hỏi
Có gì chưa rõ trong bài? Đặt câu hỏi đầu tiên — câu trả lời từ cộng đồng giúp bạn (và người sau).
Đặt câu hỏi đầu tiên