[Database] 선택도 (Selectivity), 드라이빙 테이블 (Driving Table) & 드리븐 테이블 (Driven Table), CPU 브랜치 (CPU Branch) & 브랜치 예측, 브랜치 미스프레딕션 (Branch Misprediction)

2025. 12. 11. 14:39

특정 조건(WHERE절 등)을 적용했을 때 전체 데이터 중 “얼마나 적은 비율”이 선택되는지 나타내는 값

드라이빙 테이블 (DrivingTable)

Driving table은 조인(Join)을 수행할 때 기준이 되는 테이블을 말합니다. (조인 순서를 결정할 때 가장 먼저 읽기 시작하는 테이블)

보통 선택도(Selectivity)가 높아서 결과 행(row)이 적은 테이블이 드라이빙 테이블이 되며 가장 이상적이다. (연산 최적화)

for each row in Driving Table:         ← 외부 루프 (드라이빙)
    find matching rows in Driven Table ← 내부 루프 (드리븐)

일반적으로 로직이 이렇게 돌아가기 때문에 드라이빙이 100개면 드리븐 테이블이 아무리 커도 인덱스가 있어서 특정 row에 접근해 매핑시키지만 만약 드라이빙이 1억개면 드리븐 테이블이 작아도 1억번은 반복해야하기 때문에 극심한 손해가 있습니다.

(100*1억과 1억*100은 반복 숫자는 똑같지만 인덱스로 찾아가면 1억개의 데이터를 인덱스로 찾는게 더 좋습니다. → 그래서 인덱스가 드리븐 테이블에 필요)

드리븐 테이블 (Driven Table)

Driving Table의 결과를 기준으로 조인해서 읽혀지는 대상 테이블 (Driving Table의 키 값을 이용해 반복적으로 접근)

드라이빙 테이블 기반으로 드리븐 테이블 조회하기 때문에 드리븐 테이블 조인 컬럼에 인덱스가 있어야 빨리 찾을 수 있다.

CPU에서 프로그램의 실행 흐름이 분기되는 지점(branch)으로 실행해야 할 다음 명령어의 주소가 달라지는 순간이 바로 브랜치입니다.

브랜치가 있으면 CPU는 다음에 어떤 명령을 미리 가져올지 알 수 없게 됩니다.

그래서 CPU는 branch predictor(분기 예측기)를 사용해 조건이 참일지? 거짓일지? 점프할지? 하지 않을지? 를 미리 예측합니다.

예측이 틀리면 CPU는 이미 로드해둔 명령어들을 모두 폐기하고 초기화하는 과정에서 큰 성능 손실이 일어나게 됩니다.

사용자는 SQL을 작성하지만 DB 엔진 내부에서는 아래 단계를 거칩니다

SQL → 실행 계획 → 연산자 코드 → CPU 명령어 실행

여기서 CPU는 반복(loop), 조건 검사, 비교 등을 수행하는데 이 과정에서 브랜치(branch)가 매우 많습니다.

즉, 쿼리 성능의 상당 부분이 CPU 브랜치의 효율에 의해 좌우됩니다.

🔗 참고 및 출처

https://insight-bgh.tistory.com/500

[Database] DB 정규화 (제 0정규형 (UNF), 제 1정규형 (1NF), 제 2정규형 (2NF), 제3정규형 (3NF), BCNF (Boyce–Codd Normal Form)) (0)	2025.09.29
[Database] DB 인덱스 (Index), DB Cursor(커서), 함수(function), 스토어드 프로시져 (Stored Procedure), BigInt, SmallInt (2)	2025.08.11
[Database] INSERT, UPDATE, DELETE, SELECT 부하순서, DB Page(페이지), DB 락(LOCK), 행락(Row Lock), 페이지 락(Page Lock), 테이블 락(Table Lock), 범위 락(Range Lock), DB락 에스컬레이션, 분산락 (펜싱토큰, 하트비트), DB CRUD와 멱등성 (0)	2025.08.05
[Database] DB 격리 수준 (READ UNCOMMITTED, READ COMMITTED, REPEATABLE READ, SERIALIZABLE (직렬화)), DB 동시성 문제 : 더티리드 (Dirt Read), Non-Repeatable Read, 팬텀 리드(Phantom Read), Lost Update, 비관적 락 vs 낙관적 락 (MVCC), DBMS 격리 수준 및 MVCC (7)	2025.08.05
[Database] 인덱스 vs 클러스터링 인덱스, 힙 테이블, Auto Increment vs Sequence(시퀀스), 단일 인덱스, 복합 인덱스, 카디널리티, ISAM, B-Tree(B 트리), B+Tree, 이진트리 (0)	2025.07.31

개발자 블로그