설계·방법론
(펌) 배민은 서비스 장애를 어떻게 없앴나
codeManager
2022. 6. 11. 00:22
반응형
https://byline.network/2020/12/17-108/
배민은 서비스 장애를 어떻게 없앴나 - Byline Network
A매치 축구대회나 프로야구 코리안시리즈와 같은 대형 스포츠 이벤트가 있을 때 나는 경기 시작 한참 전에 치킨을 배달시키곤 했었다. 너무 빨리 주문하는 바람에 막상 경기가 시작됐을 때는 치
byline.network
간단하게 정리
모놀리틱에서 MSA로 전환 배경
- 사용자가 몰리면 장애가 발생해서 전환 필요
- DB에 영향이 생기면 전체 서비스가 장애 발생
배민 아키텍처 정리
1. 마이크로서비스들이 이벤트 기반으로 연결
-
ex) 주문이 들어오면 주문 시스템은 주문이 들어왔다는 이벤트를 발생시키고 끝난다. 다른 시스템에 정보를 API로 직접 넘겨주는 것을 최소화
-
장애가 전파되는 것을 방지하기 위한 조치
-
이벤트 기반으로 연결할 경우 데이터 동기화 이슈가 있지만 시스템 안정성을 더 우선시한 판단
2. CQRS 아키텍처
-
시스템의 상태를 변경하는 작업(명령)과 조회하는 작업을 분리하는 것을 의미
-
핵심 비즈니스 명령이 있는 시스템과 조회 중심의 사용자 서비스를 분리
-
성능이 중요한 고객 접점의 외부 시스템, 비즈니스 명령이 많은 내부 시스템으로 분리가 되어 있음
반응형