흐름
개발자 · 개발팀 PC
- IntelliJ · Continue
- Claude Code · OpenCode
- 브라우저(Open WebUI)
🔒 폐쇄망 · 코드·데이터 외부 반출 0
LiteLLM 게이트웨이 :4000
OpenAI /v1 · Anthropic /v1/messages
가상키 · 쿼터 · 라우팅
LLM 채팅 · 에이전트 :8000
gpt-4o · 256K 컨텍스트
인라인 자동완성 내부
code-completion
운영 어플라이언스 · DGX-SPARK(GB10)
서비스 구성
| 서비스 | 역할 | 포트 |
| devportal | 설치·매뉴얼·제안 포털 (nginx) | 80 |
| litellm | LLM 게이트웨이 (OpenAI·Anthropic 호환) + 관리 UI | 4000 |
| vllm | 채팅·에이전트 모델 (gpt-4o · 256K) | 8000 |
| vllm-fim | 인라인 자동완성 (code-completion) | 내부 |
| openwebui | 브라우저 채팅 UI (비개발자·빠른 질의) | 3000 |
| litellm-db | Postgres — LiteLLM 키/사용량 저장 | 내부 |
| gitlab | 소스관리 + CI | 8929 · ssh 2289 |
| gitlab-runner | CI 실행기 | — |
| grafana | 모니터링 대시보드 (GPU·LLM·사용량) | 3001 |
| prometheus · dcgm-exporter | 메트릭 수집 · GPU exporter | 내부 |
보안 경계 · 데이터 흐름
| 원칙 | 구현 |
| 코드·데이터 외부 반출 0 | 모든 추론·소스관리·CI가 어플라이언스 내부에서 완결. 외부 인터넷 egress 없음. |
| 단일 진입점 | 모든 도구가 LiteLLM 게이트웨이 하나로 연결 — OpenAI·Anthropic 호환. |
| 도구 무변경 연동 | Claude Code는 ANTHROPIC_BASE_URL을 사내 게이트웨이로 지정 → 외부(api.anthropic.com) 미접속. |
| 외부 트래픽 차단 | 설치 시 텔레메트리·자동업데이트·오류리포트 비활성화 (CLAUDE_CODE_DISABLE_NONESSENTIAL_TRAFFIC 등). |
| 키·사용 귀속 | LiteLLM 가상키로 개인·팀별 발급·쿼터·사용량 추적 (로드맵). |
폐쇄망 운영: 설치 시점에만 모델·이미지 다운로드용 네트워크가 필요하며, 이후 운영은 완전 폐쇄망에서 가능합니다. 모든 의존성(컨테이너·모델·플러그인)은 사내 레지스트리로 미러링합니다.