LiteLLM

LiteLLM은 여러 LLM 제공사를 하나의 인터페이스로 통합하는 프록시 프레임워크입니다.
모델 간 자동 폴백, 비용 추적, 로드밸런싱을 손쉽게 구성할 수 있습니다.

설치

pip install litellm

기본 설정

import litellm
import os

litellm.api_key = os.environ["IWINV_API_KEY"]
litellm.api_base = "https://ai-api.iwinv.kr/v1"

기본 호출

response = litellm.completion(
    model="openai/gemma4-26b",  # provider/model-id 형식
    messages=[{"role": "user", "content": "안녕하세요!"}],
    api_base="https://ai-api.iwinv.kr/v1",
    api_key=os.environ["IWINV_API_KEY"]
)
print(response.choices[0].message.content)

모델 폴백

특정 모델 호출 실패 시 자동으로 다른 모델로 전환합니다.

response = litellm.completion(
    model="openai/gemma4-26b",
    messages=[{"role": "user", "content": "안녕하세요!"}],
    fallbacks=["openai/gemma4-31b", "openai/gpt-4.1"],
    api_base="https://ai-api.iwinv.kr/v1",
    api_key=os.environ["IWINV_API_KEY"]
)

LiteLLM 프록시 서버 연동

LiteLLM 프록시 서버를 iwinv API와 연결하는 설정입니다.

# config.yaml
model_list:
  - model_name: gemma4-26b
    litellm_params:
      model: openai/gemma4-26b
      api_base: https://ai-api.iwinv.kr/v1
      api_key: os.environ/IWINV_API_KEY

  - model_name: claude-sonnet
    litellm_params:
      model: openai/sonnet-4.6
      api_base: https://ai-api.iwinv.kr/v1
      api_key: os.environ/IWINV_API_KEY

litellm --config config.yaml --port 4000

설치​

기본 설정​

기본 호출​

모델 폴백​

LiteLLM 프록시 서버 연동​

설치

기본 설정

기본 호출

모델 폴백

LiteLLM 프록시 서버 연동