콘텐츠로 이동

시작하기

BSGateway는 LLM API 요청의 복잡도를 분석해 가장 비용 효율적인 모델로 자동 라우팅하는 프록시입니다.

  • 요청 복잡도 분석: 간단한 질문은 저렴한 모델로, 복잡한 작업은 고성능 모델로
  • 비용 최적화: 동일한 품질을 유지하면서 LLM 비용을 절감
  • OpenAI 호환 API: 기존 코드 변경 없이 엔드포인트만 교체
Terminal window
git clone https://github.com/blas1n/BSGateway.git
cd BSGateway

gateway.yaml에 사용할 모델과 라우팅 규칙을 정의합니다:

models:
- id: claude-sonnet
provider: anthropic
api_key: ${ANTHROPIC_API_KEY}
- id: gpt-4o-mini
provider: openai
api_key: ${OPENAI_API_KEY}
routing:
default_model: gpt-4o-mini
rules:
- pattern: "*/complex/*"
model: claude-sonnet
Terminal window
docker compose up -d

기존 OpenAI SDK 코드에서 base URL만 변경하면 됩니다:

from openai import OpenAI
client = OpenAI(
base_url="http://localhost:4000/v1",
api_key="your-bsgateway-api-key",
)
response = client.chat.completions.create(
model="auto", # BSGateway가 최적 모델 자동 선택
messages=[{"role": "user", "content": "Hello!"}],
)