Q: Tại sao Spring Data chọn parse tên method lúc startup thay vì lúc method được gọi lần đầu? Lợi ích thiết kế là gì?

Spring Data parse và compile derived query lúc startup để thực hiện chiến lược fail fast : nếu tên method sai (property không tồn tại, keyword không hợp lệ, kiểu return không tương thích), app không khởi động được ngay thay vì âm thầm ném exception khi có request đầu tiên. Lợi ích cụ thể: lỗi lộ ra tại môi trường CI/CD (khi chạy build + test) hoặc ngay khi developer khởi động app local — không phải lúc 2 giờ sáng khi user gửi request vào production. Lợi ích thứ hai là performance : parsing tên method và compile JPQL là thao tác tốn CPU. Làm một lần lúc startup và cache lại TypedQuery giúp mỗi request chỉ mất chi phí bind parameter + execute SQL, không parse lại. Đây là cùng triết lý với ApplicationContext eager-init singleton lúc startup — toàn bộ Spring framework ưu tiên "phát hiện sớm" hơn "lazy discover khi đã muộn".

Question 1

Khi bạn khai báo 'List findByStatusAndOwnerId(TaskStatus status, Long ownerId)'

Accepted Answer

Bước 1 — Parse tên method (PartTree): Spring Data đọc tên method findByStatusAndOwnerId , tách thành verb ( findBy ), property đầu ( Status ), toán tử ( And ), property thứ hai ( OwnerId ). Kết quả là một cây PartTree mô tả: "SELECT entity Task WHERE status = ? AND ownerId = ?". Bước 2 — Sinh JPQL (QueryUtils): từ cây PartTree , Spring Data dựng câu JPQL dùng tên entity Java và tên field Java : 'SELECT t FROM Task t WHERE t.status = :status AND t.ownerId = :ownerId' . JPQL không chứa tên bảng hay tên cột SQL. Bước 3 — Hibernate dịch sang SQL: EntityManager compile JPQL thành TypedQuery . Hibernate dùng Dialect của database (ví dụ PostgreSQLDialect ) để dịch JPQL thành SQL thật, áp dụng naming strategy để chuyển ownerId thành owner_id . Ba bước này diễn ra một lần lúc startup . Mỗi lần gọi method sau đó chỉ bind parameter và chạy TypedQuery đã compile — không parse lại.

Question 2

Tại sao Spring Data chọn parse tên method lúc startup thay vì lúc method được gọi lần đầu? Lợi ích thiết kế là gì?

Accepted Answer

Spring Data parse và compile derived query lúc startup để thực hiện chiến lược fail fast: nếu tên method sai (property không tồn tại, keyword không hợp lệ, kiểu return không tương thích), app không khởi động được ngay thay vì âm thầm ném exception khi có request đầu tiên.

Lợi ích cụ thể: lỗi lộ ra tại môi trường CI/CD (khi chạy build + test) hoặc ngay khi developer khởi động app local — không phải lúc 2 giờ sáng khi user gửi request vào production.

Lợi ích thứ hai là performance: parsing tên method và compile JPQL là thao tác tốn CPU. Làm một lần lúc startup và cache lại TypedQuery giúp mỗi request chỉ mất chi phí bind parameter + execute SQL, không parse lại.

Đây là cùng triết lý với ApplicationContext eager-init singleton lúc startup — toàn bộ Spring framework ưu tiên "phát hiện sớm" hơn "lazy discover khi đã muộn".

Question 3

Bạn có entity Task với field assigneeId . Viết derived query để: (1) tìm task chưa có assignee

Accepted Answer

(1) Task chưa có assignee: List findByAssigneeIdIsNull(); // SQL: SELECT t.* FROM tasks t WHERE t.assignee_id IS NULL Dùng keyword IsNull — Spring Data ánh xạ thành IS NULL trong SQL. (2) 5 task mới nhất của một project: List findTop5ByProjectIdOrderByCreatedAtDesc(Long projectId); // SQL: SELECT t.* FROM tasks t // WHERE t.project_id = ? // ORDER BY t.created_at DESC // LIMIT 5 Top5 thêm LIMIT 5 . OrderByCreatedAtDesc ánh xạ thành ORDER BY created_at DESC . (3) Đếm task theo status: long countByStatus(TaskStatus status); // SQL: SELECT COUNT(*) FROM tasks t WHERE t.status = ? Verb count yêu cầu return type long hoặc Long . Spring Data sinh SELECT COUNT(*) , không load entity.

Question 4

Method sau gây lỗi gì và vì sao? 'Optional findByProjectId(Long projectId)' . Sửa đúng.

Accepted Answer

Method này không gây lỗi lúc startup — Spring Data compile được vì projectId là property hợp lệ và Optional là return type hợp lệ.

Lỗi xảy ra lúc runtime khi có nhiều hơn 1 Task có cùng projectId (điều rất bình thường vì một project có nhiều task). Hibernate ném IncorrectResultSizeDataAccessException: query did not return a unique result.

Nguyên nhân: Spring Data dùng getSingleResult() của TypedQuery khi return type là Optional<T> — JPA spec yêu cầu query phải trả đúng 1 row, không hơn.

Sửa đúng theo mục đích thực tế:

// Neu can nhieu task (binh thuong):
List<Task> findByProjectId(Long projectId);

// Neu can phan trang:
Page<Task> findByProjectId(Long projectId, Pageable pageable);

// Optional chi dung khi co unique constraint dam bao 1 row:
// Vd: Optional<Task> findByExternalId(String externalId);
//     -- khi externalId la unique index

Quy tắc: chỉ dùng Optional<T> khi có unique constraint đảm bảo tối đa 1 row khớp điều kiện.

Question 5

Khi nào nên chuyển từ derived query sang @Query ? Cho 3 ví dụ cụ thể với tên method thật.

Accepted Answer

Trường hợp 1 — Method name quá dài (vượt 4-5 điều kiện): // SAI -- kho doc, de sai List findByStatusAndProjectIdAndAssigneeIsNotNullAndDueDateBeforeAndPriorityGreaterThanEqual( TaskStatus status, Long projectId, Instant deadline, int minPriority); // DUNG -- @Query JPQL @Query(""" SELECT t FROM Task t WHERE t.status = :status AND t.projectId = :projectId AND t.assignee IS NOT NULL AND t.dueDate = :minPriority """) List findUrgentAssigned(...); Trường hợp 2 — Aggregate function (SUM, AVG, MAX): // Derived KHONG support -- khong compile // Integer sumPriorityByProjectId(Long projectId); // DUNG: @Query("SELECT SUM(t.priority) FROM Task t WHERE t.projectId = :projectId") Long sumPriorityByProject(@Param("projectId") Long projectId); Trường hợp 3 — JOIN với điều kiện trên entity liên kết: // Derived khong the express dieu kien tren entity join // Tim task cua project co status = ACTIVE: @Query(""" SELECT t FROM Task t JOIN t.project p WHERE p.status = :projectStatus AND t.status = :taskStatus """) List findByProjectStatusAndTaskStatus( @Param("projectStatus") ProjectStatus projectStatus, @Param("taskStatus") TaskStatus taskStatus); Nguyên tắc chọn: nếu đặt tên method mà cảm thấy khó đọc hoặc phải giải thích, đó là tín hiệu chuyển @Query . Mục tiêu là code tự documenting — cả derived lẫn @Query đều phục vụ điều đó, chỉ khác ngưỡng phức tạp.

Interface	Thêm gì
`Repository`	Marker — trống, Spring Data detect bằng nó để scan
`CrudRepository`	9 method cốt lõi: `save`, `saveAll`, `findById`, `findAll`, `count`, `existsById`, `delete`, `deleteById`, `deleteAll`
`PagingAndSortingRepository`	`findAll(Pageable)` trả `Page<T>`, `findAll(Sort)`
`JpaRepository`	`flush`, `saveAndFlush`, `deleteInBatch`, `getReferenceById` (reference không load ngay), `findAll(Example)`

Verb	Ý nghĩa	Return type
`find…By`	SELECT	`Optional<T>`, `List<T>`, `Page<T>`, `Stream<T>`
`count…By`	SELECT COUNT	`long`
`exists…By`	SELECT 1	`boolean`
`delete…By`	DELETE (cần `@Modifying`)	`long`, `void`

Keyword	SQL tương ứng
(không có) / `Equals`	`= ?`
`Not`	`!= ?`
`LessThan` / `LessThanEqual`	`< ?` / `<= ?`
`GreaterThan` / `GreaterThanEqual`	`> ?` / `>= ?`
`Between`	`BETWEEN ? AND ?`
`In` / `NotIn`	`IN (?)` / `NOT IN (?)`
`Containing`	`LIKE %?%`
`StartingWith`	`LIKE ?%`
`EndingWith`	`LIKE %?`
`IgnoreCase`	`LOWER(col) = LOWER(?)`
`IsNull` / `IsNotNull`	`IS NULL` / `IS NOT NULL`
`True` / `False`	`= true` / `= false`
`OrderBy`	`ORDER BY`

Số điều kiện	Khuyến nghị
1-3	Derived query — ngắn, tự documenting
4-5	Cân nhắc — method name bắt đầu dài
6+	Chuyển sang `@Query` JPQL

JpaRepository & Derived Queries — zero-code query từ tên method

1. JpaRepository — cây phân cấp interface

Proxy sinh tự động

2. Cơ chế bên dưới — parse tên method thành JPQL

2.1 Grammar tên method đầy đủ

2.2 Xác minh SQL sinh ra

3. Khi nào derived query đủ — khi nào chuyển @Query

4. Pitfall phổ biến

5. Liên hệ các bài khác

Tóm tắt

Tự kiểm tra

Chưa có câu hỏi