본문으로 건너뛰기

LlamaIndex

LlamaIndex는 문서 색인·검색 특화 RAG 프레임워크입니다.
대규모 문서 기반 AI 서비스 구축에 최적화되어 있습니다.

설치

pip install llama-index llama-index-llms-openai

기본 설정

from llama_index.llms.openai import OpenAI
import os

llm = OpenAI(
model="gemma4-26b",
api_key=os.environ["IWINV_API_KEY"],
api_base="https://ai-api.iwinv.kr/v1"
)

기본 호출

response = llm.complete("iwinv 클라우드에 대해 알려주세요.")
print(response.text)

문서 기반 Q&A

from llama_index.core import VectorStoreIndex, Document
from llama_index.llms.openai import OpenAI
from llama_index.core import Settings

# LLM 설정
Settings.llm = OpenAI(
model="gemma4-26b",
api_key=os.environ["IWINV_API_KEY"],
api_base="https://ai-api.iwinv.kr/v1"
)

# 문서 로드
documents = [
Document(text="iwinv는 국내 클라우드 서비스 기업입니다."),
Document(text="iwinv AI API는 단일 Key로 다양한 LLM을 사용할 수 있습니다."),
Document(text="iwinv GPU 서버는 RTX 4090, RTX 5090 등을 지원합니다.")
]

# 인덱스 생성
index = VectorStoreIndex.from_documents(documents)

# 질의
query_engine = index.as_query_engine()
response = query_engine.query("iwinv AI API가 무엇인가요?")
print(response)

채팅 엔진

대화 문맥을 유지하는 채팅 엔진입니다.

chat_engine = index.as_chat_engine()

response = chat_engine.chat("iwinv AI API를 사용하려면 어떻게 해야 하나요?")
print(response)

response = chat_engine.chat("비용은 어떻게 청구되나요?")
print(response)