“Concurrency limit reached for requests”라는 메시지가 포함된 429 오류는 W&B Inference API에 동시 요청을 너무 많이 보내고 있음을 의미합니다.Documentation Index
Fetch the complete documentation index at: https://wb-21fd5541-john-wbdocs-2044-rename-serverless-products.mintlify.app/llms.txt
Use this file to discover all available pages before exploring further.
이런 일이 발생하는 이유
할 수 있는 작업
-
동시 요청 수 줄이기
- 애플리케이션에서 요청 큐잉이나 스로틀링을 구현합니다
- 실패한 요청을 재시도할 때 지수 백오프를 사용합니다
-
한도 늘리기
- 현재 플랜의 동시성 한도를 검토하고, 필요하면 업그레이드합니다
할당량 및 요청 속도 제한