핵심 개념 — BSVibe

라우팅 파이프라인

BSGateway는 모든 API 요청을 4단계 파이프라인으로 처리합니다. 각 단계에서 매칭되면 해당 모델로 라우팅되고, 매칭되지 않으면 다음 단계로 넘어갑니다.


요청 수신 → ① Passthrough → ② Alias → ③ Pattern → ④ Auto → 모델 호출

요청의 model 파라미터가 등록된 모델 ID와 정확히 일치하면 해당 모델로 직접 전달합니다.


{ "model": "claude-sonnet", "messages": [...] }
// → 등록된 claude-sonnet 모델로 직접 전달

짧은 별명을 통해 모델을 참조합니다. 대시보드 Rules 페이지에서 설정합니다.

요청의 메타데이터나 내용에 따라 glob 패턴으로 모델을 선택합니다. Rules 페이지에서 패턴과 우선순위를 설정합니다.

예시:

우선순위가 높은 규칙이 먼저 평가됩니다.

위 3단계에서 매칭되지 않은 요청은 **분류기(Classifier)**가 복잡도를 분석해 최적 모델을 자동 선택합니다. model="auto"로 요청하면 이 단계가 실행됩니다.

분류기는 요청의 복잡도를 simple, moderate, complex 중 하나로 판단합니다.

대시보드 Rules → Auto Routing 섹션에서 분류 전략을 선택합니다:

Static이 기본값이며, 정확도가 중요한 경우 LLM 또는 ML 전략을 사용합니다.

모든 API 요청의 토큰 사용량과 비용이 자동으로 기록됩니다:

Analytics 페이지에서 기간별 필터(Today / Last 7 days / Last 30 days)로 확인할 수 있습니다.

Analytics 대시보드