Skip to Content
BSGateway설정

모델 관리

사이드바 Models 페이지에서 LLM 모델을 추가하고 관리합니다.

Models 페이지

모델 추가

Add Model 버튼을 클릭하고 다음 필드를 입력합니다:

필드필수설명
ProviderO모델 제공자 — Anthropic, OpenAI, Google, Ollama 등
Model IDOAPI 요청 시 사용할 고유 식별자 (예: claude-sonnet)
API KeyOProvider에서 발급받은 API 키 (AES-256-GCM 암호화 저장)
Max Tokens-최대 출력 토큰 수 (미설정 시 Provider 기본값)
API Base-커스텀 엔드포인트 (Ollama 등 자체 호스팅 모델용)

모델 수정/삭제

모델 목록에서 각 모델의 Edit 또는 Delete 버튼을 사용합니다. API Key는 수정 시 새로 입력해야 합니다 (기존 키는 표시되지 않음).

권장 구성

최소 2개 이상의 모델을 등록하는 것을 권장합니다:

역할모델 예시용도
저비용gpt-4o-mini간단한 질문, 번역, 분류
고성능claude-sonnet코드 생성, 분석, 장문 작성
프리미엄claude-opus복잡한 추론, 수학, 아키텍처 설계

라우팅 설정

사이드바 Rules 페이지에서 라우팅 규칙을 관리합니다. 상세 설정은 라우팅 규칙 문서를 참고하세요.

CORS 설정

프론트엔드에서 BSGateway API를 직접 호출하는 경우, 허용할 도메인을 설정해야 합니다.

대시보드 우측 상단 ⚙️ → Settings에서:

  1. CORS Origins 섹션으로 이동
  2. 허용할 도메인 추가 (예: https://myapp.com)
  3. Save 클릭

API 엔드포인트

엔드포인트메서드설명
/v1/chat/completionsPOSTOpenAI 호환 채팅 API
/v1/modelsGET등록된 모델 목록
/healthGET서비스 상태 확인
/health/readyGETDB/Redis 연결 상태 확인

채팅 API 요청 형식

POST https://api-gateway.bsvibe.dev/v1/chat/completions Authorization: Bearer bsg_your_api_key Content-Type: application/json { "model": "auto", "messages": [ {"role": "system", "content": "You are a helpful assistant."}, {"role": "user", "content": "Hello!"} ], "temperature": 0.7, "max_tokens": 1024 }

응답 형식

{ "id": "chatcmpl-...", "object": "chat.completion", "model": "claude-sonnet", "choices": [ { "index": 0, "message": { "role": "assistant", "content": "Hello! How can I help you today?" }, "finish_reason": "stop" } ], "usage": { "prompt_tokens": 25, "completion_tokens": 12, "total_tokens": 37 } }

응답의 model 필드에는 실제로 사용된 모델 ID가 표시됩니다. auto로 요청했더라도 실제 선택된 모델이 반환됩니다.

에러 코드

코드설명
400잘못된 요청 형식
401API 키가 유효하지 않음
404지정한 모델이 등록되지 않음
429Rate Limit 초과
500서버 내부 오류
502Provider API 호출 실패
Last updated on