9편까지 파이프라인 내부의 기술적 이야기를 계속 했는데, 정작 “이 시스템이 실제로 어떻게 생겼고 어떻게 돌아가는지”를 보여드린 적이 없었습니다.

이번 글은 중간 점검입니다. AI Factory의 대시보드 UI를 하나씩 둘러보면서, 아이디어 발굴부터 앱 배포까지 실제 화면으로 파이프라인이 어떻게 동작하는지 보여드리겠습니다!!

바로 본론으로 들어가겠습니다!!


대시보드 전체 구조

AI Factory 대시보드는 Railway에 배포되어 있고, 웹 브라우저에서 접속합니다.

대시보드 전체 화면

사이드바 메뉴:
├── 🏠 대시보드 (홈)
├── 💡 아이디어
├── 💬 기획 채팅
├── 📁 프로젝트
└── ⚙️ 설정

1단계: 아이디어 발굴 — Scout Agent

💡 아이디어 탭을 열면 Scout Agent가 자동으로 수집한 앱 아이디어 목록이 나옵니다.

아이디어 목록

Scout Agent는 매일 자동으로 뉴스와 트렌드를 수집하고, AI가 아이디어를 5개씩 생성합니다. GPT-4.1 mini로 뉴스를 수집하고, Claude Sonnet으로 아이디어를 구체화하는 2단계 구조입니다.

마음에 드는 아이디어를 클릭하면 상세 페이지로 이동하고, “프로젝트로 전환” 버튼을 누르면 다음 단계로 넘어갑니다.


2단계: 기획 — Planning AI 채팅

💬 기획 채팅 탭은 AI와 대화하면서 프로젝트를 구체화하는 공간입니다.

기획 채팅

아이디어를 프로젝트로 전환하면 자동으로 채팅 세션이 시작됩니다. Planning AI가 질문을 하면서 PRD(Product Requirements Document)를 만들어갑니다.

대화가 끝나면 AI가 자동으로 PRD를 생성하고, “기획 확정” 버튼이 나타납니다. 이 버튼을 누르면 파이프라인이 시작됩니다.

기획 확정


3단계: 프로젝트 탭 - Pipeline

기획이 확정되면 프로젝트 탭에 해당 프로젝트가 들어갑니다. 프로젝트 상세 페이지에서 확인할 수 있습니다.

프로젝트 탭은 AI Factory의 핵심 화면입니다. 기획이 확정된 프로젝트들이 카드 형태로 나열되고, 각 프로젝트의 파이프라인 상태를 실시간으로 모니터링할 수 있습니다.

프로젝트 목록

각 프로젝트 카드에는 상태 배지가 있습니다. 배지의미📐 설계 중Spec Agent가 돌아가는 중⚡ 코딩 중패킷들이 순차적으로 코딩되는 중🚀 배포 준비빌드 + 배포 진행 중✅ 라이브배포 완료, 서비스 가동 중❌ 실패파이프라인 중단

프로젝트 카드를 클릭하면 프로젝트 상세 페이지로 이동합니다. 여기에 Overview, Work Packets, 이벤트 로그 등 모든 정보가 있습니다.

프로젝트 상세

3단계에서는 파이프라인 예시를 보여드리겠습니다.


3-1딘계: 설계 - Spec Agent

3단계: 설계 — Spec Agent 기획이 확정되면 Spec Agent(GPT-5.2)가 자동으로 돌아갑니다. 프로젝트 상세 페이지의 이벤트 로그에서 실시간으로 확인할 수 있습니다. Spec Agent가 하는 일: PRD ↓ SPEC (7단계 검증) ↓ TASK (기능별 작업 정의) ↓ Work Packets (패킷별 파일 목록 + AC) 프로젝트 상세 페이지의 이벤트 로그에서 Spec Agent의 진행 상황이 실시간으로 표시됩니다.

Spec 이벤트 1

Spec 이벤트 2

Spec 이벤트 3

각 문서들이 생성되고 Design Documents의 PRD, SPEC, TASK 각 요소들을 클릭하면 AI가 생성한 설계 문서들을 볼 수 있습니다.

설계 문서


3-2단계: 코딩 — Work Packets

프로젝트 상세 → Work Packets 탭에서 각 패킷의 상태를 확인할 수 있습니다.

상태의미
🟢 GREEN테스트 + 리뷰 통과
🟡 YELLOW테스트 통과, 리뷰 점수 낮음
🔴 RED테스트 실패
코딩 중Claude Code 작업 중

패킷을 클릭하면 비용 분해가 나옵니다. [코딩$0.65 수정$0.13 리뷰72점] 형태로 코딩 비용, fix loop 비용, 리뷰 점수가 한눈에 보입니다. 8편에서 추가한 기능입니다.

Work Packets 1

Work Packets 2

Work Packets 상세 1

Work Packets 상세 2


3-3단계: 품질 검증 — Quality Gates

코딩이 완료된 패킷은 자동으로 Quality Gates를 거칩니다.

[review] Reviewing PR #3 with Claude Sonnet 4.5 (toss)
[review] Score: 74/100 — PASS
[quality] TRUST-5 판정: GREEN

체크 항목:

  1. TypeScript 컴파일 — tsc 에러 0개
  2. 테스트 실행 — vitest 전부 통과
  3. AI 코드 리뷰 — 플랫폼별 criteria
  4. TRUST-5 판정 — Tested/Readable/Unified/Secured/Trackable

Quality Gates


3-4단계: 빌드 & 배포

모든 패킷이 머지되면 빌드 + 배포 단계입니다.

플랫폼빌드배포
Webnext buildRailway API
Mobileexpo exportEAS Build
Tossait buildait deploy

이벤트 로그: 파이프라인의 블랙박스

프로젝트 상세 페이지의 이벤트 로그는 파이프라인의 모든 활동을 기록합니다.

이벤트 로그

각 줄에 비용이 표시되어서 어디서 돈이 많이 쓰이는지 바로 파악할 수 있습니다.


프로젝트 Overview: 통계 카드

카드내용예시
💰 총 비용LLM 비용$23.50
📦 패킷전체 / GREEN / YELLOW / RED13 / 11 / 2 / 0
✅ 성공률GREEN 패킷 비율85%
⏱️ 소요 시간시작~완료157분

진행 타임라인:

Spec ━━━✅━━━ Scaffold ━━━✅━━━ Coding ━━━⚡━━━ Review ━━━⬜━━━ Deploy
                                    (7/13)

플랫폼 선택

 WebMobileToss
UI 시스템shadcn/ui + TailwindNativeWind + RNTDS
CLAUDE.mdweb용 (237줄)mobile용toss용 (98줄)
환각 방지불필요일부 필요필수

실제 결과: RentCheck

가장 최근 파이프라인 결과입니다. 1~9편의 모든 개선이 반영된 상태입니다.

전체 요약

항목
프로젝트RentCheck — 전세·월세·매매 순자산 비교 시뮬레이터
총 패킷13개
성공11/13 (85%)
실패2개 (통합 패킷 — compliance 오탐)
총 시간157.9분
총 비용$23.50

패킷별 상세

ID제목코딩수정리뷰tsc에러결과
0001도메인/타입 정의$0.48$0.11740GREEN
0002localStorage 헬퍼$0.46$0.4462→657→0GREEN
0003Context + 디바운스$0.28$0800GREEN
0004프리셋 상수$0.16$0840GREEN
0005시뮬레이션 엔진$1.14$0.5862→650GREEN
0006공유 인코드/디코드$0.37$0740GREEN
0007홈 페이지$0.37$0.4462→652→0GREEN
0008입력 페이지$0.81$0.1742→650GREEN
0009결과 페이지$0.60$0.69682→0GREEN
0010히스토리 페이지$0.68$0.92663→2→0GREEN
0011공유 진입 페이지$0.20$0.17800GREEN
0012통합(App.tsx)$0.4568→720RED
0013라우팅 와이어링$0.18760RED

TDS tsc 에러 극적 감소

9편에서 TDS 문서를 통일하고 CLAUDE.md를 98줄로 축소한 효과입니다.

 Run 4 (이전)Run 5 (이번)
UI 패킷 최대 tsc 에러15개3개
UI 패킷 평균 tsc 에러~8개~1.4개
tsc 에러로 인한 YELLOW1건0건

통합 패킷 실패 원인

실패한 0012, 0013은 tsc 0에러, 테스트 통과인데 Quality RED가 나왔습니다. compliance 체커가 App.tsx의 flex/grid 레이아웃용 style=를 “TDS 오버라이드”로 잘못 탐지한 것입니다. 이미 수정 완료했습니다. 이 2개가 성공했으면 13/13 GREEN이었습니다.


현재 수치 요약

항목수치
전체 코드~8,000줄
총 커밋112회+
개발 기간약 3주
에이전트6종
LLM 모델6종 병행
지원 플랫폼3종 (Web, Mobile, Toss)
앱 1개 비용~$23 (토스, 13패킷)
패킷 성공률85% (Run 5)

10편을 마치며

1편에서 성공률 0%였던 파이프라인이 10편 시점에서는 85% 성공률(실질 100%), 6개 에이전트, 3개 플랫폼을 지원하는 시스템이 되었습니다.

대시보드에서 아이디어를 선택하고 기획을 확정하면, 나머지는 파이프라인이 자동으로 처리합니다. 사람이 할 일은 기획 채팅에서 몇 번 대화하고 확정 버튼을 누르는 것뿐입니다.

남은 과제:

  1. Visual Review 활성화 — 토스에서 Playwright + Claude Vision 시각 평가
  2. 벤치마크 Eval Suite — 파이프라인 변경 효과 정량 측정
  3. UI 패킷 리뷰 점수 개선 — 현재 평균 63점

감사합니다!!


현재 파이프라인 전체 구조

flowchart TD
    subgraph row1 ["아이디어 → 기획"]
        direction LR
        Scout["Scout Agent\nGPT-4.1 mini + Sonnet"] --> Planning["Planning AI\n채팅 → PRD"]
    end
    subgraph row2 ["설계 → 준비"]
        direction LR
        Spec["Spec Agent\n7단계 검증"] --> Platform["플랫폼 분기\nWeb / Mobile / Toss"]
        Platform --> Scaffold["Scaffold\n+ CLAUDE.md"]
    end
    subgraph row3 ["TDD → 코딩"]
        direction LR
        TDD["TDD Tester"] --> Coding["Coding Agent\n적응형 모델"]
        Coding --> Review["Quality Gates\nTRUST-5"]
    end
    subgraph row4 ["배포"]
        direction LR
        Build["빌드"] --> Deploy["배포\nRailway / EAS / ait"]
        Deploy --> Heal["Self-Heal"]
    end
    row1 --> row2 --> row3 --> row4

© 2025. All rights reserved.

김민제의 블로그