본문으로 건너뛰기

Ollama (가상서버)

KR1-Z07에서 제공되는 가상서버에서 사용할 수 있는 Ollama는 CPU 및 GPU을 혼합해서 사용 할 수 있는 경량 플랫폼으로 전용 리포지토리를 통해 양자화 모델을 작동 할 수 있습니다.

  • 상품이 활성화가 되어있지 않은 경우는 온라인 기술지원에 해당 내용을 남겨주시면 담당자 확인후 서비스 신청 가능여부를 재확인해 드리겠습니다.
  • 상품 신청 및 사용 가이드는 가상서버 가이드를 참고 해주시기 바랍니다.
  • 리얼 서버(베어메탈, 맞춤형 서버) 기반의 GPU 상품은 cloudv에서 주문하실 수 있습니다.
정보
  • 지능형 챗봇 플랫폼 및 생성형 API 시스템
  • RAG 및 검색 기반 AI 서비스
  • 블록체인 및 AI 연계한 DApp 수행
  • 사용자 경험(UX) 및 비주얼 데이터 최적화 서비스
  • reference 매뉴얼을 통한 손쉬운 설치 및 사용 방법 제안

상품 사양 정보 및 LLM 모델 벤치마크

A6000

제원 : CUDA 10,752, 48GB(GDDR6-ECC)

상품명GPUGPU memoryvCPUMemoryStorage(OS)Traffic가격(부가세 별도)
A6000.G1148GB8vCPU60GB100GB620GB/월18,200원/일 490,000/월
A6000.G2296GB16vCPU120GB100GB620GB/월36,300원/일 980,000/월
A6000.G44192GB32vCPU240GB100GB620GB/월72,600원/일 1,960,000/월

A6000.G1 기준 벤치마크 자료

매개변수컨텍스트 길이양자화크기DRAM 사용량VRAM 사용량출력 Token/s
Gemma3 12B128KQ4_K_M8.1GB10GB10551MB52.944
Gemma3 27B128KQ4_K_M17GB26GB19753MB29.152
DeepSeek-R1 7B128KQ4_K_M4.7GB6GB5457MB92.682
DeepSeek-R1 14B128KQ4_K_M9GB10GB10741MB53.8
DeepSeek-R1 32B128KQ4_K_M19GB20GB21619MB26.38
DeepSeek-R1 70B128KQ4_K_M42GB40GB44029MB13.636
Llama 4 - Scout 109B10MBQ4_K_M67GB55GB45613MB7.596
Llama 3.3 70B128KQ4_K_M46GB41GB44021MB14.06
Llama 3.2 11B128KQ4_K_M7.8GB9GB11289MB88.8
Llama 3.2 90B128KQ4_K_M67GB55GB47645MB5.272
Phi4 14B16KQ4_K_M12GB11GB11013MB54.602
HyperCLOVA X SEED 1.5B128KF164.9GB4GB4385MB132.408
HyperCLOVA X SEED 3B128KQ4_K_M4GB3GB3581MB138.266

4000Ada

제원 : CUDA 6144, 20GB(GDDR6-ECC)

상품명GPUGPU memoryvCPUMemoryStorage(OS)Traffic가격(부가세 별도)
4000Ada.G1120GB8vCPU60GB100GB620GB/월9,200원/일 248,500/월
4000Ada.G2240GB16vCPU120GB100GB620GB/월18,400원/일 495,000/월
4000Ada.G4480GB32vCPU240GB100GB620GB/월36,700원/일 990,000/월

4000Ada.G1 기준 벤치마크 자료

매개변수컨텍스트 길이양자화크기DRAM 사용량VRAM 사용량출력 Token/s
Gemma3 12B128KQ4_K_M8.1GB15.2GB9852MB33.684
Gemma3 27B128KQ4_K_M17GB27.4GB16144MB10.762
DeepSeek-R1 7B128KQ4_K_M4.7GB9.4GB4916MB57.72
DeepSeek-R1 14B128KQ4_K_M9GB16.5GB9512MB31.094
DeepSeek-R1 32B128KQ4_K_M19GB16.7GB19116MB8.488
DeepSeek-R1 70B128KQ4_K_M42GB39.5GB18540MB1.72
Llama 4 - Scout 109B10MBQ4_K_M81GB54.9GB16450MB5.49
Llama 3.3 70B128KQ4_K_M46GB39.8GB18542MB1.736
Llama 3.2 11B128KQ4_K_M7.8GB6.8GB11114MB55.61
Llama 3.2 90B128KQ4_K_M67GB54.6GB18812MB1.616
Phi4 14B16KQ4_K_M12GB7.6GB9750MB32.026
HyperCLOVA X SEED 1.5B128KF164.9GB2.1GB3858MB80.738
HyperCLOVA X SEED 3B128KQ4_K_M4GB1.1GB2838MB100.594
Qwen3 30B256KQ4_K_M18GB15.8GB18436MB75.102
Qwen3 32B40KQ4_K_M20GB17.7GB18796MB7.17
Qwen3 235B256KQ4_K_M142GBxxx
GPT-OSS 20B128KMXFP413.2GB15.8GB13748MB43.582
GPT-OSS 120B128KMXFP465GB15.8GB16598B3.454

Tesla T4

제원 : CUDA 2,560, 16GB(GDDR6)

상품명GPUGPU memoryvCPUMemoryStorage(OS)Traffic가격(부가세 별도)
T4.G1116GB6vCPU30GB100GB620GB/월6,260원/일 169,000원/월
T4.G2232GB12vCPU60GB100GB620GB/월12,520원/일 338,000원/월
T4.G4464GB24vCPU120GB100GB620GB/월25,040원/일 676,000원/월

T4.G1 기준 벤치마크 자료

매개변수컨텍스트 길이양자화크기DRAM 사용량VRAM 사용량출력 Token/s
Gemma3 12B128KQ4_K_M8.1GB8.5GB10345MB16.716
Gemma3 27B128KQ4_K_M17GB17.2GB12669MB6.026
DeepSeek-R1 7B128KQ4_K_M4.7GB5GB5257MB28.814
DeepSeek-R1 14B128KQ4_K_M9GB9GB10703MB12.982
DeepSeek-R1 32B128KQ4_K_M19GB19.4GB13995MB4.378
DeepSeek-R1 70B128KQ4_K_M42GBXXX
Llama 4 - Scout 109B10MBQ4_K_M67GB54.9GB11403MB4.268
Llama 3.3 70B128KQ4_K_M46GB49GB13617MB1.434
Llama 3.2 11B128KQ4_K_M7.8GB8.3GB11103MB30.898
Llama 3.2 90B128KQ4_K_M67GB56.4GB13815MB1.396
Phi4 14B16KQ4_K_M12GB9GB10813MB11.66
HyperCLOVA X SEED 1.5B128KF164.9GB3.5GB4213MB58.324
HyperCLOVA X SEED 3B128KQ4_K_M4GB2.5GB3431MB56.738

PRO6000

제원 : 24,064, 96GB(GDDR7-ECC)

상품명GPUGPU memoryvCPUMemoryStorage(OS)Traffic가격(부가세 별도)
PRO6000.G1196GB8vCPU120GB100GB620GB/월51,480원/일 1,390,000원/월
PRO6000.G22192GB16vCPU240GB100GB620GB/월102,960원/일 2,780,000원/월
PRO6000.G44384GB32vCPU480GB100GB620GB/월205,920원/일 5,560,000원/월

PRO6000.G1 기준 벤치마크 자료

매개변수컨텍스트 길이양자화크기DRAM 사용량VRAM 사용량출력 Token/s
Gemma3 12B128KQ4_K_M8.1GB9.2GB10291MB79.328
Gemma3 27B128KQ4_K_M17GB17.6GB19223MB49.176
DeepSeek-R1 7B128KQ4_K_M4.7GB5.1GB5351MB145.958
DeepSeek-R1 14B128KQ4_K_M9GB9.3GB9949MB96.326
DeepSeek-R1 32B128KQ4_K_M19GB18.5GB20571MB50.686
DeepSeek-R1 70B128KQ4_K_M42GB40GB42513MB25.802
Llama 4 - Scout 109B10MBQ4_K_M81GB64B65627MB64.614
Llama 3.3 70B128KQ4_K_M46GB47GB42513MB26.212
Llama 3.2 11B128KQ4_K_M7.8GB8.4GB11605MB134.944
Llama 3.2 90B128KQ4_K_M67GB52GB57365MB25.946
Phi4 14B16KQ4_K_M12GB9.2GB10165MB124.876
HyperCLOVA X SEED 1.5B128KF164.9GB4GB4207MB230.462
HyperCLOVA X SEED 3B128KQ4_K_M4GB2.8GB3277MB211.628
Qwen3 30B256KQ4_K_M18GB17.6GB18881MB153.862
Qwen3 32B40KQ4_K_M20GB19GB21109MB50.454
Qwen3 235B (G2)256KQ4_K_M142GB134GB70393MB/68189MB54.344
GPT-OSS 20B128KMXFP413.2GB15GB14115MB133.604
GPT-OSS 120B128KMXFP465GB63GB63473MB100.72

상품 가격은 변동될 수 있으며 2025년 8월 기준 작성되었습니다.
정확한 내용은 홈페이지 소개 페이지를 참고하시기 바랍니다.

정보
  • 벤치마크 테스트는 NGC 공식 컨테이너 nvcr.io/nvidia/pytorch:25.06-py3 환경에서 수행되었으며 본 결과 공개는 NVIDIA의 “Deep Learning Containers – Benchmarking” 문서에 따른 예외 조항에 근거합니다.
  • 테스트 결과는 자사가 직접 실험한 수치로, NVIDIA의 공식 성능과 무관하며, 미세한 환경 차이에 따라 결과는 다를 수 있으니 참고용 데이터로 활용하시기 바랍니다.