운영자 · SI · DGX-SPARK(GB10)

DGX-SPARK에 풀스택 한 줄 설치

새 DGX-SPARK(GB10) 머신에 KAIDA 어플라이언스를 한 줄로 설치합니다. 완료되면 LLM·자동완성·데브포탈·GitLab이 모두 자동 기동됩니다.

사전 조건

NVIDIA DGX-SPARK(GB10), Ubuntu, NVIDIA 드라이버 설치됨
설치 시점 네트워크(이미지·모델 다운로드용) — 이후 운영은 폐쇄망 가능
root 권한, 디스크 여유(모델·이미지·GitLab repo 포함 권장 200GB+)

설치 (한 줄)

새 DGX-SPARK(GB10)에서 root로 실행:

❯curl -fsSL https://dev.kopens.ai/gb10-setup.sh | sudo bash

Docker·NVIDIA Container Toolkit 설치 → 어플라이언스 번들 다운로드 → 어플라이언스별 시크릿 자동 생성 → docker compose up → 모델 자동 다운로드.

첫 기동은 모델 로딩·GitLab 초기화로 수 분~십수 분 걸립니다.

설치되는 구성

서비스	역할	포트
devportal	설치·매뉴얼 포털	80
litellm	LLM 게이트웨이 (OpenAI/Anthropic 호환) + 관리 UI	4000
openwebui	브라우저 채팅 UI (비개발자 · 빠른 질의)	3000
vllm	채팅/에이전트 모델 (gpt-4o · 256K 컨텍스트)	8000
vllm-fim	인라인 자동완성 (code-completion)	내부
gitlab	소스관리 + CI	8929 (ssh 2289)
gitlab-runner	CI 실행기	—

설치 후 접속

항목	URL
데브포탈	`http://<서버-IP>/`
LLM API	`http://<서버-IP>:4000/v1`
LiteLLM 관리 UI	`http://<서버-IP>:4000/ui` (admin)
GitLab	`http://<서버-IP>:8929` (root)

생성된 시크릿(LLM 키, UI/GitLab root 비밀번호)은 /opt/kopens-ai/.env에 저장됩니다. 안전하게 보관하세요.

운영 명령

cd /opt/kopens-ai
docker compose ps              # 상태
docker compose logs -f vllm    # 모델 로딩 로그
docker compose restart litellm # 재시작
docker compose down            # 정지