RPT-009, WKS-001, RPT-008, PTN-003 문서를 리뷰하고, 대시 크리에이터의 핵심 기능과 텔레그램 연동을 위한 구체적 설계 및 POC 계획을 보고합니다.
핵심 추출: 대시 크리에이터는 14번(대화형 모듈 생성 + QR + 카메라 DB) + 18번(멀티 LLM 라우팅) 차별점의 구현체. "모든 사용자가 크리에이터"를 실현하는 핵심 기술. OpenClaw는 개발자만 Skill 생성 가능하나, The Universe는 비개발자도 대화만으로 대시 생성.
개발 관점: Playground(웹) + 메신저(텔레그램) 두 인터페이스, 동일한 생성 엔진. QR 스캔 → 모듈 자동 생성, 카메라 OCR → DB 구축 기능 필수. 어댑터 패턴으로 인터페이스 분리 설계.
핵심 추출: 사용자 플로우 8단계(말하기→질문→선택→검색→추천→생성→미리보기→저장), 크리에이터 엔진 7-Stage 파이프라인(의도파싱→질문생성→Store검색→코드생성→미리보기→패키징→저장). AI 요구사항 9건(의도 파싱, 질문 생성, Store 검색, 코드 생성, 멀티 LLM, 수정 반영, 프롬프트 체인, 미리보기, 패키징). 시나리오 A(출근길 대시) 상세 플로우 완성.
개발 관점: 7-Stage 파이프라인이 개발 백본. POC에서는 8-Stage로 확장(카메라 OCR + QR 생성 추가). Stage별 마이크로서비스 또는 모듈 분리 설계 필요. 랄프루프 ACT: 의도 파싱 정확도 벤치마크 + 모바일 대응 추가 필요.
핵심 추출: 5종 LLM 비용 비교 — 최적 라우팅 시 건당 $0.011~0.035(₩15~47), 단일 고급 모델(Claude Sonnet) $0.085+(₩114+), 자사 LLM 목표 $0.005(₩7). 코드 생성 단계가 비용의 70~80% 차지. 코드 생성만 고급 모델, 나머지는 저가/온디바이스 모델.
개발 관점: LLM 라우터를 파이프라인 초기부터 설계. 모델별 API 추상화 레이어 필수. 비용 모니터링 대시보드. Stage별 모델 교체가 무중단으로 가능해야 함.
핵심 추출: 11건 발굴, 출원 추천 8건. P-06(자연어 대화→모듈 자동 생성, 신규성 높음), P-01(QR 스캔→모듈 자동 생성), P-04(카메라→DB 자동 구축), P-09(작업 난이도 기반 멀티 LLM 자동 라우팅)이 기술 구현 핵심 4건.
개발 관점: 특허 청구항 범위를 고려한 설계 필요. 각 특허 요소가 독립 모듈로 구현되어야 청구항 분리 용이. 특히 P-06의 "선택지 기반 질문→모듈 생성" 파이프라인과 P-09의 "단계별 LLM 라우팅"은 아키텍처 설계에 직접 반영.
| 원칙 | 설계 | 이유 |
|---|---|---|
| 인터페이스 분리 | 메신저 봇은 어댑터. 엔진은 하나. | 텔레그램 먼저, 디스코드/카톡은 어댑터만 추가 |
| Stage 독립 | 8-Stage 각각 독립 모듈. API 경계 명확 | 특허 청구항 분리 + 단위 테스트 + 교체 용이 |
| LLM 추상화 | LLM 호출을 추상 인터페이스로. 모델 교체 무중단 | 비용 최적화 라우팅 + 신규 모델 즉시 추가 |
| 세션 상태 관리 | Redis 기반 대화 세션. 멀티턴 컨텍스트 유지 | 대화형 생성은 다수의 턴이 필요 |
| 컴포넌트 | 기술 | 담당 |
|---|---|---|
| Bot Framework | python-telegram-bot 또는 Telegraf.js (Node.js) | COM |
| Webhook | Telegram Bot API Webhook → 서버 엔드포인트 | BKP |
| 세션 관리 | Redis (대화 상태 + 선택지 컨텍스트) | DAT |
| 메시지 포맷 | Inline Keyboard (선택지 버튼) + Reply Markup | COM |
| 이미지 처리 | 메뉴판 사진 수신 → OCR 서비스 호출 | MLE |
| QR 생성 | qrcode 라이브러리 → 이미지 생성 → 봇이 전송 | FE(WDR) |
| Stage | 기능 | 입력/출력 | LLM | 담당 |
|---|---|---|---|---|
| 1. 의도 파싱 | 자연어 → 의도 분류 (생성/검색/수정/QR) | IN: 텍스트 OUT: 의도 JSON | Gemini Nano / Flash | PME + AIE |
| 1.5 카메라 OCR | 메뉴판/간판 이미지 → 구조화 DB | IN: 이미지 OUT: 메뉴 JSON | Gemini Pro (멀티모달) | MLE |
| 2. 질문 생성 | 누락 맥락 파악 → 선택지 질문 생성 | IN: 의도 + 컨텍스트 OUT: 질문 + 선택지 | GPT-4o-mini / Flash | PME |
| 3. Store 검색 | 유사 대시 검색 + 추천 | IN: 요구사항 OUT: 대시 목록 | Embedding + Flash | BKP |
| 4. 코드 생성 | DASH.md + Skin(Compose) + Skill(로직) | IN: 요구사항 전체 OUT: 코드 파일들 | Claude Sonnet / Gemini Pro | AIE + PME |
| 5. 미리보기 | 생성된 코드를 렌더링하여 미리보기 제공 | IN: 코드 OUT: 스크린샷/URL | — | WDR |
| 6. 패키징 | .dpk 자동 빌드 + EdDSA 서명 | IN: 코드 OUT: .dpk 파일 | — | CTL + DVO |
| 6.5 Store 분석 | 유사 대시 존재 여부 + 추천 판단 | IN: 대시 메타 OUT: 추천 여부 | Flash | BKP |
| 7. 저장 | 내 Playground에 저장. Store 공유 선택. | IN: .dpk OUT: 저장 확인 | — | BKP |
| 8. QR 생성 | 가게 대시 전용 QR 코드 생성 | IN: 대시 ID OUT: QR 이미지 | — | FE(WDR) |
| 시나리오 | 복잡도 | 예상 비용 | 주요 모델 |
|---|---|---|---|
| 시계 대시 | simple | ₩5 | Nano + Flash + Gemini Pro |
| 날씨 대시 | medium | ₩55 | Flash + Gemini Pro |
| 출근길 대시보드 | medium | ₩55 | Flash + Gemini Pro |
| 매출 트래커 | complex | ₩120 | Flash + Claude Sonnet |
| 가게 QR 대시 (사장님) | medium + OCR | ₩100 | Gemini Pro(OCR) + Flash |
목표: 텔레그램에서 대화만으로 "날씨 대시"를 생성하고, 내 Playground에 저장하는 end-to-end 플로우 검증
| Day | 작업 | 담당 | 산출물 |
|---|---|---|---|
| D1 | 텔레그램 Bot 생성 + Webhook 설정 | COM | 봇 토큰 + 엔드포인트 |
| D2 | 세션 관리 (Redis) + 대화 상태 머신 | DAT + COM | 세션 API |
| D3 | 의도 파싱 (Stage 1) + 질문 생성 (Stage 2) | PME + AIE | 프롬프트 + API |
| D4 | 코드 생성 (Stage 4) — 날씨 대시 템플릿 | AIE + RUN | DASH.md 생성기 |
| D5 | LLM 라우터 v0.1 (Gemini Flash + Pro 2종) | AIE | 라우터 API |
| Day | 작업 | 담당 | 산출물 |
|---|---|---|---|
| D6 | 텔레그램 ↔ 엔진 통합. Inline Keyboard 대화 | COM + AIE | 대화 플로우 동작 |
| D7 | 미리보기 (Playground 링크 또는 스크린샷) | WDR | 미리보기 URL |
| D8 | .dpk 패키징 + Playground 저장 | CTL + DVO | .dpk 파일 |
| D9 | end-to-end 테스트 (날씨 대시 전체 플로우) | QA | 테스트 리포트 |
| D10 | 비용 측정 + 성능 벤치마크 + POC 보고 | BIA + CTL | POC 결과 보고서 |
| 기준 | 목표 | 측정 방법 |
|---|---|---|
| 대화 완성도 | 3~5턴 이내 요구사항 수집 완료 | 10건 테스트 케이스 통과율 |
| 생성 품질 | 날씨 대시가 정상 렌더링 + 데이터 표시 | 시각 검수 |
| 응답 속도 | 각 턴 응답 3초 이내. 코드 생성 15초 이내 | latency 측정 |
| 비용 | 날씨 대시 1건 ₩55 이하 | API 비용 로깅 |
| LLM 라우팅 | Stage별 최적 모델 자동 선택 동작 | 라우팅 로그 확인 |
| 역할 | 에이전트 | POC 담당 |
|---|---|---|
| 총괄 | CTL (CTO·Tech Lead) | 아키텍처 설계, .dpk 패키징, POC 리드 |
| LLM 통합 | AIE (LLM Integration Lead) | 5종 LLM API 연동, 라우터 v0.1 |
| 프롬프트 | PME (Prompt Engineer) | 의도 파싱 + 질문 생성 프롬프트 체인 |
| ML/OCR | MLE (ML Engineer) | Gemini Nano PoC, 카메라 OCR (Phase 2) |
| 텔레그램 봇 | COM (Communication) | Bot Framework + Webhook + Inline Keyboard |
| 백엔드 API | BKP (Platform Backend) | Store 검색 API, 세션 관리 |
| 데이터 | DAT (Data) | Redis 세션, 대시 메타 DB |
| 런타임 | RUN (Runtime) | DASH.md 파서, 코드 생성 보조 |
| DevOps | DVO (DevOps) | CI/CD, 서버 환경, 배포 |
| QA | QA (외부 — T4) | end-to-end 테스트 |
| 비용 분석 | BIA (외부 — T1) | 비용 측정 + 벤치마크 |
CTL(개발팀장) × 전 개발팀원 합동 보고 · 2026-03-29