Thuật toán Ứng dụng — DP, String, Big Data & hơn nữa/TF-IDF — chấm điểm liên quan cổ điển
51/66
Bài 51 / 66~18 phútSearch engine algorithmsMiễn phí lượt xem

TF-IDF — chấm điểm liên quan cổ điển

Trọng số term theo tần suất trong document (TF) và độ hiếm toàn corpus (IDF). Vì sao term hiếm quan trọng hơn term phổ biến.

🚧 Đang biên soạn

Bài học này đang được biên soạn — phần dưới là đề cương dự kiến để định hướng nội dung. Code sẽ dùng pseudocode tiếng Việt có dấu; mỗi bài concept có TL;DR + mermaid + self-check 5–7 câu.

Loại bài: Bài concept

Đề cương dự kiến

  • TF: tần suất term
  • IDF: độ hiếm
  • TF-IDF score
  • Hạn chế (không bão hoà)

Bài tiếp theo: BM25 — chấm điểm chuẩn công nghiệp

Bài này có giúp bạn hiểu bản chất không?

Hỏi đáp về bài này

Chưa có câu hỏi

Đặt câu hỏi

Có gì chưa rõ trong bài? Đặt câu hỏi đầu tiên — câu trả lời từ cộng đồng giúp bạn (và người sau).

Đặt câu hỏi đầu tiên