처리율 제한(Rate Limiting)에 관하여

카테고리 없음

sanook 2021. 8. 29. 23:57

클라이언트 or 서비스가 보내는 트래픽의 처리율을 제어하기 위한 장치이다
예시 : HTTP의 경우 특정 기간 내에 전송되는 클라이언트의 요청 횟수를 제한하며 API 요청 횟수가 제한 장치에 정의돈 임계치를 넘어서면 추가로 도달한 모든 호출은 처리가 중단 된다

클라이언트 : 쉡게 위변조가 가능하고 모든 클라이언트 통제가 어려울 수 있다
서버 : API 서버에 두거나 처리율 제한 미들웨어인 API 게이트웨이를 두어 API 서버로 가는 요청을 통제하도록 해야 한다
- 이때, 프로그래밍 언어, 캐시 서비스등 사용하고 있는 기술 스택을 고려하고 필요에 맞는 처리율 제한 알고리즘을 찾아야 한다

토큰 버킷 : 지정된 용량을 갖는 컨테이너
사전 설정된 양의 토큰이 주기적으로 채워지며 꽉 찬 버킷에는 더 이상의 토큰이 추가되지 않고 버려진다(overflow)
처리될 때마다 요청당 하나의 토큰을 사용하며 요청 도착시 버킷에 충분한 토큰이 있는지 검사한다
- 충분한 토큰이 있는 경우 : 버킷에서 토근을 꺼내 요청을 시스템에 전달함
- 충분한 토큰이 없는 경우 : 요청은 버려짐
파라미터
- 버킷 크기 : 최대로 담을 수 있는 토큰의 개수
- 토큰 공급률 : 초당 몇개의 토큰이 버킷에 공급되는지
적용 기준
- API 앤드포인트 or IP 주소 or 시스템의 처리율(모든 요청이 하나의 버킷 공유)
장점
- 구현이 쉽다
- 버킷 크기가 정해져 있어 효율적으로 메모리를 사용할 수 있다
- 버킷에 남은 토큰이 있다면 시스템에 전달됨으로 짧은 시간에 집중되는 트래픽 처리가 가능하다
단점
- 버킷 크기와 토큰 공급률을 튜닝하기가 어렵다

요청 처리율이 정해져 있으며 요청이 도착하면 큐가 가득 차 있는지 확인 후 있다면 큐에 요청을 추가, 없다면 새 요청은 버린다
보통 FIFO로 구현하며 정해진 시간마다 요청을 꺼내어 처리한다
파라미터
- 버킷 크기 : 처리될 항목들이 보관된 큐의 크기
- 처리율 : 보통 초 단위로 표현되는 시간당 몇 개의 항목을 처리할 지에 대해 정해진 값
장점
- 큐의 크기가 제한되어 있어 메모리를 효율적으로 사용할 수 있다
- 고정된 처리율을 가지고 있어 안정적인 출력이 가능하다
단점
- 단시간에 트래픽이 몰리고 제때 처리하지 못한다면 오래된 요청은 남고 최신 요청들은 버려진다
- 버킷 크기와 처리율을 튜닝하기가 어렵다

출저
알렉스 쉬 Alex Xu, 『가상 면접 사례로 배우는 대규모 시스템 설계 기초』, 이병준 옮김, 인사이트(2021), p51-74.