운영자 · SI · DGX-SPARK(GB10)

DGX-SPARK에 풀스택 한 줄 설치

새 DGX-SPARK(GB10) 머신에 KAIDA 어플라이언스를 한 줄로 설치합니다. 완료되면 LLM·자동완성·데브포탈·GitLab이 모두 자동 기동됩니다.

사전 조건

설치 (한 줄)

1
새 DGX-SPARK(GB10)에서 root로 실행:
curl -fsSL https://dev.kopens.ai/gb10-setup.sh | sudo bash
Docker·NVIDIA Container Toolkit 설치 → 어플라이언스 번들 다운로드 → 어플라이언스별 시크릿 자동 생성 → docker compose up → 모델 자동 다운로드.
첫 기동은 모델 로딩·GitLab 초기화로 수 분~십수 분 걸립니다.

설치되는 구성

서비스역할포트
devportal설치·매뉴얼 포털80
litellmLLM 게이트웨이 (OpenAI/Anthropic 호환) + 관리 UI4000
openwebui브라우저 채팅 UI (비개발자 · 빠른 질의)3000
vllm채팅/에이전트 모델 (gpt-4o · 256K 컨텍스트)8000
vllm-fim인라인 자동완성 (code-completion)내부
gitlab소스관리 + CI8929 (ssh 2289)
gitlab-runnerCI 실행기

설치 후 접속

항목URL
데브포탈http://<서버-IP>/
LLM APIhttp://<서버-IP>:4000/v1
LiteLLM 관리 UIhttp://<서버-IP>:4000/ui (admin)
GitLabhttp://<서버-IP>:8929 (root)
생성된 시크릿(LLM 키, UI/GitLab root 비밀번호)은 /opt/kopens-ai/.env에 저장됩니다. 안전하게 보관하세요.

운영 명령

cd /opt/kopens-ai
docker compose ps              # 상태
docker compose logs -f vllm    # 모델 로딩 로그
docker compose restart litellm # 재시작
docker compose down            # 정지