Thuật toán Ứng dụng — DP, String, Big Data & hơn nữa/BM25 — chấm điểm chuẩn công nghiệp
52/66
Bài 52 / 66~20 phútSearch engine algorithmsMiễn phí lượt xem

BM25 — chấm điểm chuẩn công nghiệp

Cải tiến TF-IDF: bão hoà tần suất term và chuẩn hoá độ dài document. Vì sao BM25 là mặc định của Elasticsearch/Lucene.

🚧 Đang biên soạn

Bài học này đang được biên soạn — phần dưới là đề cương dự kiến để định hướng nội dung. Code sẽ dùng pseudocode tiếng Việt có dấu; mỗi bài concept có TL;DR + mermaid + self-check 5–7 câu.

Loại bài: Bài concept

Đề cương dự kiến

  • Vấn đề của TF-IDF
  • Saturation (k1) + length norm (b)
  • Công thức BM25
  • Elasticsearch dùng BM25

Bài tiếp theo: PageRank — xếp hạng theo liên kết

Bài này có giúp bạn hiểu bản chất không?

Hỏi đáp về bài này

Chưa có câu hỏi

Đặt câu hỏi

Có gì chưa rõ trong bài? Đặt câu hỏi đầu tiên — câu trả lời từ cộng đồng giúp bạn (và người sau).

Đặt câu hỏi đầu tiên