Chapter 6. Partitioning

Database 2021. 2. 18. 14:48

서비스의 크기가 커져 데이터가 쌓이면 DB 용량의 한계와 성능 저하 이슈가 발생한다. Full Scanning의 범위도 증가하고, Index Table 자체의 크기도 커져 자연스럽게 삽입, 삭제, 탐색 연산의 성능저하가 발생한다.

따라서 테이블을 물리적으로 분할하는 파티셔닝 기법이 나왔다. 이때 테이블을 여러 개의 파티션으로 분할하기 위해서는 키 값에 따라 어떤 파티션에 속하는지 알아야한다.

테이블에 담긴 데이터가 줄어들어 풀 스캐닝의 성능도 좋아지고, 인덱스 테이블의 크기도 작아져 DML 성능도 좋아진다.
데이터를 분할하여 저장해 물리적 데이터 손실 시 일부 데이터만 손실되고, 파티셔닝마다 다르게 백업하여 백업의 비용을 줄일 수 있다. Ex) 연도별 데이터 백업

테이블의 컬럼을 나눈다. 즉, 스키마를 나누어 데이터를 저장한다.
한 테이블을 조회하면 결국 모든 컬럼을 메모리에 올리게 되므로 필요 없는 컬럼까지 올라가서 한 번에 읽을 수 있는 ROW가 줄어든다. 만약 컬럼을 분할하면 한 번에 읽을 수 있는 ROW가 증가하여 I/O 측면에서 봤을 때 성능상 이점이 생긴다.
하지만 컬럼의 중복이 발생한다.

개발노트 개발노트