Bài 45 / 60~22 phútEXPLAIN & query optimizationMiễn phí… lượt xem

Tuning toolbox — 6 cách fix theo hierarchy chi phí thấp → cao

Q: "Query `WHERE assignee_id = 5 AND status = 'doing'` chạy 800ms trên 1M row dù đã có index `(assignee_id)`. Trước khi thêm composite index

Đúng thứ tự: (1) Tier 1 — kiểm tra xem query có thể rewrite không: SELECT * cần thiết hay có thể thu hẹp column list? (2) Tier 2 — kiểm tra `last_analyze` và `n_mod_since_analyze` từ `pg_stat_user_tables`. Nếu stats stale sau bulk insert, chạy `ANALYZE tasks` trước — estimate sai có thể đang khiến planner không dùng index có sẵn. (3) Chỉ sau khi Tier 1 và 2 không đủ mới thêm composite index `(assignee_id, status)` ở Tier 3. Tại sao đúng thứ tự: Rewrite và ANALYZE có chi phí bằng 0 — nếu chúng fix được vấn đề thì không cần thêm write overhead của index. Thêm index mà stats stale vẫn có thể bị planner bỏ qua nếu estimate row count quá cao và planner ưu tiên Seq Scan.

Q: Bạn tạo 6 index trên bảng `tasks` để cover mọi query pattern. 1 tháng sau INSERT throughput giảm 55%. Diagnose và fix như thế nào?

Diagnose: Mỗi INSERT/UPDATE phải update tất cả index liên quan → write amplification. 6 index = tối đa 6x I/O write per INSERT. Kiểm tra index usage: SELECT indexname, idx_scan FROM pg_stat_user_indexes WHERE tablename = 'tasks' ORDER BY idx_scan ASC — index nào idx_scan = 0 hoặc rất thấp sau 30 ngày là index chưa được dùng. Fix: DROP các index idx_scan = 0 — chúng chỉ có write cost mà không có read benefit. Merge các index có leftmost prefix overlap thành 1 composite index thay vì nhiều index riêng. Cân nhắc partial index cho index chỉ cần trên subset hot row — nhỏ hơn, maintenance nhanh hơn. Mục tiêu: giữ số index ở mức tối thiểu cover các query critical.

Q: EXPLAIN ANALYZE vẫn cho `rows=500000 actual rows=120` dù đã chạy ANALYZE. Tier tiếp theo nên thử là gì? Giải thích cơ chế.

Tier 4 — Tăng statistics_target: ANALYZE đã chạy nhưng estimate vẫn sai → histogram và MCV quá thô với `default_statistics_target=100`. Với column có distribution rất skewed (ví dụ `assignee_id` với 5% top user chiếm 60% task), MCV 100 entry không đủ để bắt pattern này. Cơ chế: Tăng ALTER TABLE tasks ALTER COLUMN assignee_id SET STATISTICS 1000; ANALYZE tasks; → ANALYZE thu thập ~300.000 sample thay vì 30.000 → MCV 1000 entry → histogram 1000 bucket → planner có thể estimate chính xác hơn cho assignee có traffic cao. Sau đó kiểm tra lại EXPLAIN ANALYZE xem rows estimate có gần actual rows hơn không. Nếu sau Tier 4 vẫn sai, cân nhắc CREATE STATISTICS extended cho cross-column correlation (bài 4 của module này).

Q: Tại sao `REFRESH MATERIALIZED VIEW CONCURRENTLY` bắt buộc cần UNIQUE INDEX? Điều gì xảy ra nếu không có?

Cơ chế CONCURRENTLY: REFRESH CONCURRENTLY hoạt động bằng cách build data mới vào temporary table song song, sau đó diff với MV hiện tại (dùng UNIQUE INDEX để xác định row nào đã thay đổi, row nào mới, row nào bị xoá). Cuối cùng apply diff — chỉ lock ngắn ở bước swap cuối, cho phép SELECT chạy trong suốt quá trình. Không có UNIQUE INDEX: PostgreSQL không thể thực hiện diff algorithm vì không có cách xác định row uniqueness. REFRESH CONCURRENTLY sẽ throw error: "ERROR: cannot refresh materialized view concurrently ... without any unique index" . PostgreSQL fallback về REFRESH MATERIALIZED VIEW thường nếu bạn bỏ CONCURRENTLY — nhưng cách này lock toàn bộ MV, block mọi SELECT trong khi refresh.

Q: "Sau `ALTER SYSTEM SET default_statistics_target = 500`

Tại sao estimate cũ: pg_reload_conf() nạp lại config file → PostgreSQL biết target mới là 500. Nhưng pg_stats vẫn chứa statistics cũ được thu thập với target=100: MCV 100 entry, histogram 100 bucket. Planner vẫn dùng statistics cũ đó vì chưa có lần ANALYZE nào chạy với target mới. Cần làm thêm: ANALYZE; (hoặc ANALYZE tasks; cho table cụ thể). Sau ANALYZE với target=500: sample ~150.000 row thay vì 30.000, build MCV 500 entry và histogram 500 bucket. Planner lần kế tiếp đọc statistics mới chi tiết hơn → estimate chính xác hơn. Luôn nhớ: thay đổi statistics_target chỉ có hiệu lực sau lần ANALYZE tiếp theo.

Q: Dashboard analytics đang dùng Materialized View refresh mỗi 5 phút. Product team yêu cầu một số metric cần real-time (ví dụ số task đang 'doing' của team). Bạn sẽ thiết kế solution như thế nào? Không được xoá MV cũ.

Thiết kế hybrid: Giữ MV cho metrics chấp nhận 5 phút delay (monthly aggregate, historical trend). Với metric cần real-time, query trực tiếp từ tasks table nhưng với index tối ưu. Cụ thể: Tạo composite index CREATE INDEX idx_tasks_doing ON tasks(project_id, status) WHERE status = 'doing' INCLUDE (assignee_id); — partial index chỉ index row status='doing' , nhỏ và nhanh. Query real-time: SELECT count(*) FROM tasks WHERE project_id = $1 AND status = 'doing' → Index Only Scan, <2ms. Dashboard endpoint gọi MV cho historical data và query trực tiếp cho real-time count — frontend hiểu 2 nguồn data có độ fresh khác nhau. Đây là pattern "tiered freshness": MV cho aggregate chịu được staleness, direct query cho metric cần real-time. Không one-size-fits-all — thiết kế theo SLA freshness của từng metric.

Sau khi diagnose bad plan, áp 6 cách fix theo thứ tự: rewrite query → ANALYZE → add index → statistics_target → materialized view → restructure schema. Mỗi tier có EXPLAIN before/after trên TaskFlow.

Bài 5 của module này đã diagnose được bad plan — bạn biết planner đang chọn sai và tại sao. Bước tiếp theo là fix. Nhưng không phải mọi vấn đề cần giải pháp nặng như thêm index hay redesign schema. Có một hierarchy 6 cấp từ chi phí thấp đến cao — luôn thử từ cấp thấp trước, chỉ leo lên cấp cao hơn khi cấp dưới không đủ.

Đây là bộ công cụ thực chiến: bạn sẽ không cần tất cả 6 cấp cho mọi query — 80% vấn đề giải quyết được ở cấp 1–3.

1. Analogy — Tăng tốc xe ô tô

Khi xe chạy chậm, bạn không bắt đầu bằng cách thiết kế lại động cơ. Bạn thử theo thứ tự từ rẻ đến đắt.

Cấp	Giải pháp ô tô	Giải pháp PostgreSQL	Chi phí
1	Đổi route GPS — đường tắt free	Rewrite query	0 (chỉ thay SQL)
2	Cập nhật bản đồ offline → route chính xác hơn	Chạy ANALYZE	Cheap — vài giây
3	Mở thêm làn đường	Thêm index	Storage + write cost
4	Gắn sensor lưu lượng nhiều hơn → quyết định chính xác hơn	Tăng statistics_target	Memory + planning time
5	Xây bãi đỗ xe cache gần trung tâm	Materialized view	Storage + refresh window
6	Thiết kế lại toàn bộ mạng đường	Restructure schema	Migration risk + downtime

💡 Cách nhớ

Đi từ cấp 1 lên tuần tự — chỉ leo cấp khi cấp dưới không đủ. Rewrite query và ANALYZE là free. Index đã có write cost. Materialized view có staleness. Restructure schema là major project — last resort.

2. Tier 1 — Rewrite query

Chi phí: 0. Chỉ thay đổi SQL, không thay đổi schema hay index.

Subquery correlated → JOIN:

Correlated subquery chạy lại cho mỗi row của outer query — O(n×m) thay vì O(n+m) của join.

-- Before: correlated subquery -- chay 1 lan cho moi user row
SELECT * FROM users u
WHERE EXISTS (
  SELECT 1 FROM tasks t
  WHERE t.assignee_id = u.id AND t.status = 'doing'
);

-- After: rewrite thanh JOIN + DISTINCT
SELECT DISTINCT u.* FROM users u
JOIN tasks t ON t.assignee_id = u.id
WHERE t.status = 'doing';

-- EXPLAIN: planner co the chon Hash Join thay nested correlated subquery
-- Hash Join O(n+m) vs correlated O(n*m) khi tasks lon

OR → UNION ALL (bài 5 của module này, Pattern 3):

-- Before: OR block index usage
SELECT * FROM tasks WHERE assignee_id = 5 OR project_id = 10;

-- After: UNION ALL -- moi nhanh dung index rieng
SELECT * FROM tasks WHERE assignee_id = 5
UNION ALL
SELECT * FROM tasks WHERE project_id = 10;

Tránh SELECT *:

SELECT * buộc planner phải fetch toàn bộ column từ heap — không có cơ hội dùng Index Only Scan dù index đủ rộng.

-- Before: SELECT * -> bat buoc heap fetch
SELECT * FROM tasks WHERE assignee_id = 5 AND status = 'todo';

-- After: chi lay column can -> co the Index Only Scan
SELECT id, title, due_at FROM tasks
WHERE assignee_id = 5 AND status = 'todo';

3. Tier 2 — ANALYZE

Chi phí: cheap. Sample-based, vài giây cho table 10M row. Không cần thay đổi schema hay index.

Planner quyết định dựa trên statistics — số liệu snapshot tại lần ANALYZE cuối cùng. Sau bulk insert hoặc bulk update lớn, statistics lag so với data thực tế → planner estimate sai → plan sai (bài 4 của module này).

-- Sau bulk INSERT 1M task: chay ANALYZE ngay, khong doi autovacuum
ANALYZE tasks;  -- 5-10 giay, update n_live_tup, MCV, histogram

-- Kiem tra estimate truoc vs sau:
EXPLAIN ANALYZE SELECT * FROM tasks WHERE assignee_id = 5;
-- Truoc ANALYZE: planner doan 0.5 row -> chon Nested Loop sai
-- Sau ANALYZE: doan ~200 row -> chon Index Scan dung

-- Kiem tra lan ANALYZE cuoi va muc do thay doi data:
SELECT relname, last_analyze, last_autoanalyze, n_mod_since_analyze
FROM pg_stat_user_tables WHERE relname = 'tasks';
-- n_mod_since_analyze lon -> stats co kha nang stale -> can ANALYZE

Autovacuum trigger ANALYZE khi n_mod_since_analyze > 50 + 0.1 × n_live_tup — với table 1M row: threshold 100.050 modification, có thể lag 10–30 phút sau bulk load. Chạy thủ công là an toàn nhất (bài 5 Module 6 của khoá này — autovacuum tuning).

4. Tier 3 — Add index

Chi phí: storage + write cost (mỗi INSERT/UPDATE/DELETE phải update index). Đổi lại: query read nhanh hơn nhiều.

Composite index — column order theo leftmost prefix (bài 3 Module 5 của khoá này):

-- Dashboard TaskFlow: filter theo assignee + status, sort theo due_at
-- Column order: equality truoc (assignee_id, status), range sau (due_at)
CREATE INDEX idx_tasks_dashboard
ON tasks(assignee_id, status, due_at);

Covering index với INCLUDE (bài 3 Module 5 của khoá này — Index Only Scan):

-- INCLUDE column khong dung de filter/sort, chi de cover SELECT list
-- -> Index Only Scan: doc tu index, bo qua heap hoan toan
CREATE INDEX idx_tasks_dashboard_covering
ON tasks(assignee_id, status) INCLUDE (due_at, title);

Partial index — chỉ index hot row:

-- Chi index task chua archive (hot path -- dashboard khong bao gio show archived)
-- Index nho hon (500k thay vi 1M), scan nhanh hon, maintenance nhe hon
CREATE INDEX idx_tasks_active
ON tasks(due_at) WHERE status != 'archived';

Expression index (bài 5 của module này, Pattern 1 — function wrapper):

-- Query WHERE LOWER(email) = '...' khong dung index tren email
-- Fix: index tren bieu thuc LOWER(email)
CREATE INDEX idx_users_email_lower ON users(LOWER(email));
-- Gio planner match index cho predicate LOWER(email) = 'x'

GIN cho JSONB (bài 4 Module 5 của khoá này) và EXPLAIN before/after partial index:

-- GIN: tasks.metadata la JSONB column
CREATE INDEX idx_tasks_meta ON tasks USING gin(metadata jsonb_path_ops);

-- Before (khong co index): Seq Scan, Execution Time: ~1800 ms
EXPLAIN ANALYZE
SELECT id, title, due_at FROM tasks
WHERE assignee_id = 5 AND status != 'archived'
ORDER BY due_at NULLS LAST LIMIT 20;

-- Tao partial covering index
CREATE INDEX idx_tasks_active_assignee
ON tasks(assignee_id, due_at) INCLUDE (title)
WHERE status != 'archived';

ANALYZE tasks;

-- After: Index Only Scan, Heap Fetches: 0, Execution Time: ~1.5 ms (~1200x)

5. Tier 4 — Tăng default_statistics_target

Chi phí: memory tăng nhẹ + planning time chậm lại một chút. Đổi lại: estimate chính xác hơn cho column có distribution skewed.

default_statistics_target = 100 (mặc định) thu thập MCV 100 entry và histogram 100 bucket. Với column có distribution cực kỳ lệch — ví dụ 10% top assignee chiếm 80% task — MCV 100 entry không bắt được outlier, planner estimate sai.

-- Kiem tra distribution hien tai
SELECT attname, n_distinct, most_common_vals, most_common_freqs
FROM pg_stats
WHERE tablename = 'tasks' AND attname = 'assignee_id';
-- Neu most_common_vals chi co 10 entry cho 100 possible assignee -> tang target

-- Tang statistics target cho column cu the
ALTER TABLE tasks ALTER COLUMN assignee_id SET STATISTICS 1000;
ANALYZE tasks;  -- BAT BUOC chay lai sau khi tang target

-- Hoac toan cuc trong postgresql.conf / ALTER SYSTEM:
ALTER SYSTEM SET default_statistics_target = 500;
SELECT pg_reload_conf();  -- ap dung khong can restart
ANALYZE;  -- Re-analyze tat ca table de ap dung target moi

Sau khi tăng target, EXPLAIN ANALYZE sẽ cho rows estimate chính xác hơn → planner chọn đúng join algorithm và scan strategy.

target	Sample rows	Ưu	Nhược
100 (default)	~30.000	ANALYZE nhanh	Histogram thô, MCV ít
500–1000	~150k–300k	Bắt outlier skewed, estimate chính xác	ANALYZE chậm 3–5x, planning time tăng nhẹ

Chỉ tăng cho column quan trọng trong WHERE clause của query critical — không tăng toàn cục trừ khi cần thiết.

6. Tier 5 — Materialized view

Chi phí: storage 1 lần + refresh window (data không real-time). Đổi lại: query analytics instant thay vì aggregate full table mỗi lần.

Phù hợp cho analytics aggregate — dashboard "tổng task per project per month" không cần real-time, chấp nhận delay đến lần refresh kế tiếp.

-- Dashboard analytics: tong task per project per month
CREATE MATERIALIZED VIEW mv_task_monthly AS
SELECT
  project_id,
  date_trunc('month', created_at) AS month,
  count(*)                         AS task_count,
  count(*) FILTER (WHERE status = 'done') AS done_count
FROM tasks
GROUP BY project_id, date_trunc('month', created_at);

-- UNIQUE INDEX bat buoc de dung REFRESH CONCURRENTLY
-- (neu khong co UNIQUE INDEX, REFRESH phai dung lock block SELECT)
CREATE UNIQUE INDEX ON mv_task_monthly(project_id, month);

-- Refresh non-blocking -- cho phep SELECT tiep tuc trong khi refresh
REFRESH MATERIALIZED VIEW CONCURRENTLY mv_task_monthly;

-- Query MV thay vi aggregate full table moi lan
SELECT * FROM mv_task_monthly WHERE project_id = 1 ORDER BY month;
-- ~1 ms thay vi ~500 ms aggregate raw tren 1M row

-- Kiem tra size MV
SELECT pg_size_pretty(pg_relation_size('mv_task_monthly'));
-- Truoc (aggregate raw): HashAggregate -> Seq Scan, ~480 ms tren 1M row
-- Sau (query MV): Index Scan, ~0.8 ms (~600x faster)

Tradeoff cần hiểu rõ: data trong MV chỉ fresh đến lần REFRESH cuối. Client phải biết staleness này — API contract cần document "dashboard data cập nhật mỗi 5 phút" hoặc tương tự. Bài 11 của khoá này sẽ bàn về refresh schedule và monitor MV bloat.

7. Tier 6 — Restructure schema (last resort)

Chi phí cao: migration risk, data backfill, downtime hoặc dual-write transition window. Chỉ áp dụng khi 5 cấp trên không đủ.

Denormalize (bài 4 Module 4 của khoá này): pre-join vào wide table cho hot path query analytics — embed project_name, assignee_name sẵn, tránh join runtime lặp đi lặp lại. Chỉ hiệu quả khi read >> write.
Partition (bài 12 của khoá này): split tasks theo date range — tasks_2025, tasks_2026. Query WHERE created_at >= '2026-01-01' chỉ scan partition 2026. Hiệu quả khi table rất lớn (100M+) và query hay filter theo date.
Sharding (bài 10 của khoá này): cross-node split khi 1 node không đủ throughput. Phức tạp nhất — distributed query overhead, cross-shard join không efficient.

Migration cost luôn phải tính: data migration script, backfill job, dual-write window, rollback plan.

8. pg_hint_plan — last resort hack

Extension cho phép override quyết định planner bằng hint comment inline. Hữu ích khi planner persistently chọn sai và không thể fix bằng 5 tier trên trong thời gian ngắn.

-- Cai extension (chua co trong PG core):
-- CREATE EXTENSION pg_hint_plan;

-- Hint inline: ep planner dung HashJoin va IndexScan cu the
/*+ HashJoin(t u) IndexScan(t idx_tasks_assignee) */
SELECT t.id, t.title, u.name
FROM tasks t JOIN users u ON t.assignee_id = u.id
WHERE t.status = 'doing';

Dùng pg_hint_plan với thận trọng: hint khóa plan cứng → mất khả năng adapt khi data distribution thay đổi. Nếu dữ liệu thay đổi nhưng hint không cập nhật, bạn có thể bị kẹt với plan tệ hơn trước. Coi pg_hint_plan là băng dán tạm thời — không phải giải pháp lâu dài.

Pitfall — Index không phải silver bullet, GUC reload, MV staleness

Pitfall 1 — Index write tax:

Mỗi index là một chi phí ghi. Bảng có 5 index: mỗi UPDATE phải cập nhật tất cả 5 index tương ứng column thay đổi → tối đa 5x I/O write → có thể giảm INSERT throughput 40–60% trên workload write-heavy.

-- Audit index khong duoc dung sau 30 ngay
SELECT schemaname, tablename, indexname, idx_scan
FROM pg_stat_user_indexes
WHERE tablename = 'tasks' AND idx_scan = 0;
-- idx_scan = 0 -> index khong bao gio duoc dung -> can xem xet DROP

Pitfall 2 — GUC tuning cần reload đúng cách:

-- SET chi anh huong session hien tai -- khong persist
SET default_statistics_target = 500;

-- ALTER SYSTEM ghi vao postgresql.auto.conf -- can RELOAD de ap dung
ALTER SYSTEM SET default_statistics_target = 500;
SELECT pg_reload_conf();  -- reload khong restart, ap dung ngay
ANALYZE;  -- Phai chay lai ANALYZE sau khi doi target

-- Mot so GUC can restart daemon (vd shared_buffers):
-- ALTER SYSTEM SET shared_buffers = '2GB';
-- -> Sau do phai restart PostgreSQL, pg_reload_conf() khong du

Pitfall 3 — Materialized view stale data:

-- REFRESH CONCURRENTLY can UNIQUE INDEX
-- Neu khong co UNIQUE INDEX -> REFRESH phai dung thuong
-- -> Lock block tat ca SELECT trong khi refresh -> downtime!
CREATE UNIQUE INDEX ON mv_task_monthly(project_id, month);  -- BAT BUOC

-- Client phai biet data co the lag
-- Document trong API: "task monthly data refreshed every 5 minutes"
-- Khong dung MV cho data can real-time (vd so du tai khoan, ton kho hien tai)

9. Applied — TaskFlow dashboard: 3-tier fix

Baseline: dashboard query đếm task theo status cho một assignee, chạy 125ms trên 1M row.

-- Baseline: Seq Scan + HashAggregate
EXPLAIN ANALYZE
SELECT status, count(*) FROM tasks
WHERE assignee_id = 5 AND status != 'archived'
GROUP BY status;
-- Seq Scan on tasks (cost=0..30000 rows=1000000 width=...)
--   Filter: ((assignee_id = 5) AND (status <> 'archived'))
--   Rows Removed by Filter: ~987000
-- HashAggregate
-- Execution Time: ~125 ms

Fix 1 — Tier 3: Composite partial covering index:

CREATE INDEX idx_tasks_status_count
ON tasks(assignee_id, status) WHERE status != 'archived';

ANALYZE tasks;

EXPLAIN ANALYZE
SELECT status, count(*) FROM tasks
WHERE assignee_id = 5 AND status != 'archived'
GROUP BY status;
-- Index Only Scan using idx_tasks_status_count on tasks
--   Index Cond: (assignee_id = 5)
--   Filter: (status <> 'archived')
--   Heap Fetches: 0
-- HashAggregate
-- Execution Time: ~2 ms  (~62x faster)

Fix 2 — Tier 5: Materialized view cho analytics aggregate:

-- Precompute status breakdown per assignee
CREATE MATERIALIZED VIEW mv_user_status_count AS
SELECT assignee_id, status, count(*) AS task_count
FROM tasks
WHERE status != 'archived'
GROUP BY assignee_id, status;

CREATE UNIQUE INDEX ON mv_user_status_count(assignee_id, status);

-- Query MV thay vi aggregate raw moi lan
EXPLAIN ANALYZE
SELECT * FROM mv_user_status_count WHERE assignee_id = 5;
-- Index Scan on mv_user_status_count
-- Execution Time: ~0.3 ms  (~400x faster vs baseline)

Tóm tắt 3-tier fix:

Fix	Tier	Before	After	Ratio
Baseline	—	125 ms	—	1x
Partial covering index	Tier 3	125 ms	2 ms	62x
Materialized view	Tier 5	125 ms	0.3 ms	400x

Rewrite query (Tier 1) và ANALYZE (Tier 2) đã được áp trước — query đã viết đúng, ANALYZE đã chạy sau bulk load. Tier 3 và 5 là hai bước tiếp theo cho phần lợi suất còn lại.

10. Deep Dive

Deep Dive — Tối ưu hoá PostgreSQL nâng cao

PostgreSQL Wiki — Performance Optimization — tổng hợp community: GUC tuning, index strategy, vacuum, EXPLAIN interpretation. Điểm bắt đầu tốt nhất khi gặp vấn đề hiệu năng cụ thể.
PostgreSQL Documentation — CREATE MATERIALIZED VIEW — syntax đầy đủ, REFRESH CONCURRENTLY requirements, WITH DATA/WITH NO DATA, STORAGE PARAMETERS. Đọc phần "Notes" về UNIQUE INDEX requirement cho CONCURRENTLY.
PostgreSQL 14 Internals — Egor Rogov, Part IV (Tuning chapter) — free PDF. Part IV: cost estimation internals, index types deep dive, statistics mechanics. Đọc sau khi đã quen EXPLAIN output — Rogov giải thích cơ chế bên dưới mỗi quyết định của planner.

11. Tóm tắt

Hierarchy 6 tier: rewrite (free) → ANALYZE (cheap) → index (storage+write) → statistics_target (memory+planning) → materialized view (storage+staleness) → restructure (migration risk). Đi từ thấp lên — đừng nhảy thẳng vào Tier 6.
Tier 1 — Rewrite: correlated subquery → JOIN, OR → UNION ALL, SELECT * → chỉ column cần, EXISTS thay IN large list.
Tier 2 — ANALYZE: chạy sau bulk load, không đợi autovacuum — estimate sai là root cause của hầu hết bad plan.
Tier 3 — Index: composite theo leftmost prefix, INCLUDE cho Index Only Scan, partial cho hot-row subset, expression cho function wrapper. Mỗi index là write tax — audit idx_scan = 0 thường xuyên.
Tier 4 — statistics_target: tăng per-column cho distribution skewed cao, bắt buộc ANALYZE lại sau khi thay đổi.
Tier 5 — Materialized view: query instant thay vì aggregate, REFRESH CONCURRENTLY cần UNIQUE INDEX, client phải biết staleness. Bài 11 của khoá này: refresh schedule + monitor MV bloat.
Tier 6 — Restructure: denormalize, partition (bài 12 của khoá này), sharding (bài 10 của khoá này) — last resort khi 5 tier trên không đủ.
pg_hint_plan: last resort hack override planner — hint cứng mất khả năng adapt khi data thay đổi, dùng tạm thời không phải lâu dài.

12. Tự kiểm tra

Tự kiểm tra

Query `WHERE assignee_id = 5 AND status = 'doing'` chạy 800ms trên 1M row dù đã có index `(assignee_id)`. Trước khi thêm composite index, bạn sẽ thử những bước nào theo hierarchy? Tại sao thứ tự đó đúng?

▸

Đúng thứ tự: (1) Tier 1 — kiểm tra xem query có thể rewrite không: SELECT * cần thiết hay có thể thu hẹp column list? (2) Tier 2 — kiểm tra `last_analyze` và `n_mod_since_analyze` từ `pg_stat_user_tables`. Nếu stats stale sau bulk insert, chạy `ANALYZE tasks` trước — estimate sai có thể đang khiến planner không dùng index có sẵn. (3) Chỉ sau khi Tier 1 và 2 không đủ mới thêm composite index `(assignee_id, status)` ở Tier 3.

Tại sao đúng thứ tự: Rewrite và ANALYZE có chi phí bằng 0 — nếu chúng fix được vấn đề thì không cần thêm write overhead của index. Thêm index mà stats stale vẫn có thể bị planner bỏ qua nếu estimate row count quá cao và planner ưu tiên Seq Scan.

Bạn tạo 6 index trên bảng `tasks` để cover mọi query pattern. 1 tháng sau INSERT throughput giảm 55%. Diagnose và fix như thế nào?

▸

Diagnose: Mỗi INSERT/UPDATE phải update tất cả index liên quan → write amplification. 6 index = tối đa 6x I/O write per INSERT. Kiểm tra index usage: SELECT indexname, idx_scan FROM pg_stat_user_indexes WHERE tablename = 'tasks' ORDER BY idx_scan ASC — index nào idx_scan = 0 hoặc rất thấp sau 30 ngày là index chưa được dùng.

Fix: DROP các index idx_scan = 0 — chúng chỉ có write cost mà không có read benefit. Merge các index có leftmost prefix overlap thành 1 composite index thay vì nhiều index riêng. Cân nhắc partial index cho index chỉ cần trên subset hot row — nhỏ hơn, maintenance nhanh hơn. Mục tiêu: giữ số index ở mức tối thiểu cover các query critical.

EXPLAIN ANALYZE vẫn cho `rows=500000 actual rows=120` dù đã chạy ANALYZE. Tier tiếp theo nên thử là gì? Giải thích cơ chế.

▸

Tier 4 — Tăng statistics_target: ANALYZE đã chạy nhưng estimate vẫn sai → histogram và MCV quá thô với `default_statistics_target=100`. Với column có distribution rất skewed (ví dụ `assignee_id` với 5% top user chiếm 60% task), MCV 100 entry không đủ để bắt pattern này.

Cơ chế: Tăng ALTER TABLE tasks ALTER COLUMN assignee_id SET STATISTICS 1000; ANALYZE tasks; → ANALYZE thu thập ~300.000 sample thay vì 30.000 → MCV 1000 entry → histogram 1000 bucket → planner có thể estimate chính xác hơn cho assignee có traffic cao. Sau đó kiểm tra lại EXPLAIN ANALYZE xem rows estimate có gần actual rows hơn không.

Nếu sau Tier 4 vẫn sai, cân nhắc CREATE STATISTICS extended cho cross-column correlation (bài 4 của module này).

Tại sao `REFRESH MATERIALIZED VIEW CONCURRENTLY` bắt buộc cần UNIQUE INDEX? Điều gì xảy ra nếu không có?

▸

Cơ chế CONCURRENTLY: REFRESH CONCURRENTLY hoạt động bằng cách build data mới vào temporary table song song, sau đó diff với MV hiện tại (dùng UNIQUE INDEX để xác định row nào đã thay đổi, row nào mới, row nào bị xoá). Cuối cùng apply diff — chỉ lock ngắn ở bước swap cuối, cho phép SELECT chạy trong suốt quá trình.

Không có UNIQUE INDEX: PostgreSQL không thể thực hiện diff algorithm vì không có cách xác định row uniqueness. REFRESH CONCURRENTLY sẽ throw error: "ERROR: cannot refresh materialized view concurrently ... without any unique index". PostgreSQL fallback về REFRESH MATERIALIZED VIEW thường nếu bạn bỏ CONCURRENTLY — nhưng cách này lock toàn bộ MV, block mọi SELECT trong khi refresh.

Sau `ALTER SYSTEM SET default_statistics_target = 500`, bạn chạy `SELECT pg_reload_conf()` nhưng không chạy `ANALYZE`. EXPLAIN vẫn cho estimate cũ. Tại sao? Cần làm gì thêm?

▸

Tại sao estimate cũ: pg_reload_conf() nạp lại config file → PostgreSQL biết target mới là 500. Nhưng pg_stats vẫn chứa statistics cũ được thu thập với target=100: MCV 100 entry, histogram 100 bucket. Planner vẫn dùng statistics cũ đó vì chưa có lần ANALYZE nào chạy với target mới.

Cần làm thêm: ANALYZE; (hoặc ANALYZE tasks; cho table cụ thể). Sau ANALYZE với target=500: sample ~150.000 row thay vì 30.000, build MCV 500 entry và histogram 500 bucket. Planner lần kế tiếp đọc statistics mới chi tiết hơn → estimate chính xác hơn. Luôn nhớ: thay đổi statistics_target chỉ có hiệu lực sau lần ANALYZE tiếp theo.

Dashboard analytics đang dùng Materialized View refresh mỗi 5 phút. Product team yêu cầu một số metric cần real-time (ví dụ số task đang 'doing' của team). Bạn sẽ thiết kế solution như thế nào? Không được xoá MV cũ.

▸

Thiết kế hybrid: Giữ MV cho metrics chấp nhận 5 phút delay (monthly aggregate, historical trend). Với metric cần real-time, query trực tiếp từ tasks table nhưng với index tối ưu.

Cụ thể: Tạo composite index CREATE INDEX idx_tasks_doing ON tasks(project_id, status) WHERE status = 'doing' INCLUDE (assignee_id); — partial index chỉ index row status='doing', nhỏ và nhanh. Query real-time: SELECT count(*) FROM tasks WHERE project_id = $1 AND status = 'doing' → Index Only Scan, <2ms. Dashboard endpoint gọi MV cho historical data và query trực tiếp cho real-time count — frontend hiểu 2 nguồn data có độ fresh khác nhau.

Đây là pattern "tiered freshness": MV cho aggregate chịu được staleness, direct query cho metric cần real-time. Không one-size-fits-all — thiết kế theo SLA freshness của từng metric.

⁂

Bài tiếp theo: Mini-challenge — dashboard 2s → 50ms (5M dataset)

Bài này có giúp bạn hiểu bản chất không?

Hỏi đáp về bài này

Chưa có câu hỏi

Đặt câu hỏi

Có gì chưa rõ trong bài? Đặt câu hỏi đầu tiên — câu trả lời từ cộng đồng giúp bạn (và người sau).

Đặt câu hỏi đầu tiên

← Bài trước

5 anti-pattern khiến planner chọn plan tệ

Bài tiếp

Mini-challenge M07 — Dashboard 2.1s → 50ms trên 5M task dataset