Skip to content

Workflow AI-first

Este es el pipeline completo de desarrollo con AI Framework: de idea a código en producción en 5 fases, cada una con skills dedicados y quality gates automáticos.

Antes de empezar: lee Inicio rápido para instalar el framework.


El Pipeline

💡 1. IDEA — brainstorming → plan mode

Convierte ideas vagas en diseños completos. Claude activa brainstorming automáticamente: pregunta una cosa a la vez, propone 2-3 enfoques con trade-offs, y cristaliza diseño + escenarios en plan file nativo. Ver detalle →

📋 2. PLAN — ralph-orchestrator · discovery → planning → tasks

Entry point único para desarrollo autónomo. Ralph ejecuta 8 pasos (0-7): elige modo (Interactive/Autonomous), discovery, planning, genera .code-task.md files, configura gates, y presenta plan completo en plan mode para tu aprobación antes de ejecutar. Ver detalle →

⚙️ 3. IMPLEMENT — SCENARIO → SATISFY → REFACTOR

La metodología central. Cada feature se define primero como escenario observable, se implementa hasta que el behavior converge (satisfaction, no boolean), y se refactoriza preservando behavior. Ver detalle →

🔍 4. QUALITY — 6 agents automáticos + verification gate

Seis agentes se activan solos según contexto: code-reviewer, security-reviewer, edge-case-detector, code-simplifier, performance-engineer, systematic-debugger. Verification gate de 6 pasos antes de declarar cualquier tarea completa. Ver detalle →

🚀 5. DELIVER — commit → pull-request → branch-cleanup

Commits semánticos con agrupación automática por tipo de archivo. Pull request con quality gate integrado (code review + security review en paralelo). Post-merge cleanup automático. Ver detalle →

Cada fase tiene un skill dedicado. Claude los activa automáticamente o puedes invocarlos tú.


Fase 1: Idea

Convierte ideas vagas en diseños completos mediante diálogo.

"Necesito sistema de notificaciones push"

Claude activa brainstorming automáticamente:

  1. Examina el proyecto, pregunta una cosa a la vez
  2. Propone 2-3 enfoques con trade-offs
  3. Diseña en secciones de 200-300 palabras, valida cada una
  4. Cristaliza diseño + escenarios en plan file nativo (plan mode)

Después de aprobar el plan

Según el tamaño de la tarea, continúa con:

  • Tarea pequeña → Implementa directamente (ver Patrones por tamaño)
  • Tarea mediana/granderalph-orchestrator para planificación + ejecución autónoma

Fase 2: Plan

Ralph Orchestrator recomendado

Entry point único para desarrollo autónomo. Una invocación orquesta todo el pipeline.

"Implementa el sistema de notificaciones del design doc"

Ralph ejecuta 8 pasos (0-7) en secuencia:

PasoQué haceOutput
0Elige modo: Interactive o Autonomous
1Valida prerrequisitos
2Discovery (nuevo) o Reverse (existente)discovery.md
3Planning — diseño detalladodetailed-design.md
4Task generation — todas las tareas upfront.code-task.md files
5Genera AGENTS.md para workersAGENTS.md
6Configura ejecución (quality gates).ralph/config.sh
7Plan mode + aprobación + ejecución autónomaAgent Teams

Aprobación obligatoria (Paso 7)

Ralph nunca ejecuta código sin tu aprobación. Antes de lanzar Agent Teams, presenta un plan completo en plan mode con resumen de planificación, estrategia de ejecución y configuración. Nada se ejecuta sin tu OK.

¿Qué son los modos?

Interactive — Ralph pregunta y espera confirmación en cada decisión. Para cuando quieres control granular.

Autonomous — Ralph toma decisiones solo, documenta assumptions y continúa sin bloquear. Para desarrollo overnight/AFK.

En ambos modos, la aprobación en plan mode (paso 7) es obligatoria.

SOP Pipeline manual

Si prefieres control paso a paso en lugar de Ralph, puedes invocar cada skill del pipeline individualmente:

bash
"Explora constraints y riesgos del sistema de notificaciones"
# → sop-discovery → discovery.md
bash
"Diseña la solución basándote en el discovery"
# → sop-planning → detailed-design.md + plan.md
bash
"Genera las tareas del plan"
# → sop-task-generator → .code-task.md files
bash
"Implementa la primera tarea"
# → sop-code-assist → código + tests + commit
¿Cuándo usar pipeline manual vs Ralph?

Ralph — Features completas, desarrollo overnight, cuando quieres que el framework maneje todo.

Pipeline manual — Cuando quieres iterar en una fase específica (ej: refinar el planning sin regenerar discovery), o para tareas donde solo necesitas una parte del pipeline.


Fase 3: Implement

Scenario-Driven Development metodología central

Todo código se escribe para satisfacer escenarios, nunca al revés.

Ley de hierro

NO se escribe código de producción sin un escenario definido primero. Los escenarios definen el comportamiento esperado; el código existe para satisfacerlos.

El ciclo:

1. SCENARIO — Definir qué debe pasar (user story con valores concretos)

gherkin
Dado un usuario con plan "free"
Cuando intenta enviar más de 10 notificaciones/día
Entonces recibe error "Límite diario alcanzado" y el contador no incrementa // [!code highlight]

2. SATISFY — Escribir código hasta que el escenario converge

js
// ❌ Esto NO es convergencia
test('should limit notifications', () => { expect(true).toBe(true) }) 

// ✅ Esto SÍ es convergencia
// Ejecuté sendNotification() 11 veces → observé "Límite diario alcanzado"
// y counter.value === 10 (no incrementó)
  • Ejecutar → observar output → ajustar → repetir
  • "Converge" = el behavior observable satisface al usuario, no solo "pasa un test"

3. REFACTOR — Simplificar sin romper behavior

js
// Antes
if (count >= limit) {                     
  if (plan === 'free') {                  
    throw new Error('Límite alcanzado')   
  }                                       
}                                         

// Después
const planLimits = { free: 10, pro: 100 } 
if (count >= planLimits[plan]) {          
  throw new LimitExceededError(plan)      
}                                         
  • Validar ANTES y DESPUÉS de cada cambio
  • Un cambio pequeño a la vez
  • Si algo rompe → undo inmediatamente

Enforcement automático invisible

Múltiples hooks operan en background durante toda implementación — no requieren configuración ni invocación manual:

HookTriggerQué hace
sdd-test-guardPreToolUse (Edit|Write)Si los tests están fallando Y un edit reduce assertions o debilita precisión (assertEqual→assertTrue, try/catch) → deniega el edit. Previene reward hacking.
sdd-auto-testPostToolUse (Edit|Write|Skill)Después de cada edit, lanza tests en background con trailing-edge coalescing (1 runner máximo por proyecto). Timeouts adaptativos basados en duración histórica.
constraint-reinforcementUserPromptSubmitInyecta ~55 tokens de constraints en recency zone de cada prompt — contrarresta dilución de atención en conversaciones largas.
task-completedTaskCompletedCoverage enforcement: detecta archivos sin tests. Skill enforcement: valida que SOP skills fueron invocados. Baseline comparison: distingue fallos preexistentes de regresiones.

sdd-test-guard implementa la ley de hierro: "Not M/M → fix code, never weaken scenarios." Su matriz de decisión:

TestsEditResultado
Passing + cualquier cambio→ ALLOWRefactoring legítimo
Failing + assertions ≥→ ALLOWFix o test nuevo
Failing + assertions <DENYReward hacking detectado
Failing + precision downgradeDENYWeakening semántico detectado
Sin estado + cualquier cambio→ ALLOWSin datos = sin bloqueo

sdd-auto-test cierra el loop de SDD: cada cambio al código fuente dispara tests automáticamente con coalescing (evita runners paralelos redundantes). Los resultados se reportan en el contexto del siguiente edit.

task-completed valida al completar tareas: que archivos source tengan tests correspondientes (coverage enforcement), que skills SOP fueron invocados antes de completar (skill enforcement), y que fallos nuevos no se confundan con preexistentes (baseline comparison).

Los hooks comparten estado via archivos temporales con session isolation para teammates paralelos y son invisibles en operación normal.

SDD vs TDD
Scenario (SDD)Test (TDD)
ViveSpec externa al códigoCódigo del codebase
Evalúa"¿Satisface al usuario?""¿Pasa?" (boolean)
Vulnerable aNada (holdout externo)Reward hacking
Escrito comoUser story observableAssertion técnica

SDD no reemplaza tests — los complementa. Los escenarios definen qué debe pasar; los tests verifican que siga pasando.


Fase 4: Quality

Seis agentes especializados se activan automáticamente según contexto. No necesitas invocarlos — Claude los delega cuando corresponde.

AgentQué revisaCuándo se activa
code-reviewerSDD compliance, behavioral satisfaction, reward hackingDespués de implementar un step
code-simplifierComplejidad, redundancia, nombresDespués de escribir código
security-reviewerInjection, auth bypass, secretsAntes de PR, cambios en auth/data
edge-case-detectorBoundary, concurrency, resource leaksCódigo crítico (money, state)
performance-engineerQueries, algorithmic complexity, I/OProblemas de rendimiento
systematic-debuggerRoot cause 4 fasesBug o test failure

Ver descripción detallada de cada agente en Agentes.

Verification Gate obligatorio

Antes de declarar cualquier tarea completa, verification-before-completion ejecuta un gate de 6 pasos:

  1. IDENTIFY — Listar cada claim que se está haciendo
  2. RUN — Ejecutar la verificación ahora, no después
  3. READ — Leer cada línea del output, completo
  4. VERIFY — ¿El output coincide con el claim?
  5. SATISFY — ¿Los escenarios convergen hacia satisfacción?
  6. CLAIM — Afirmar con evidencia: npm test → 47/47 ✓

Sin evidencia no hay completion

"Debería funcionar"
"Ejecuté `npm test` y observé 47/47 passing"

Fase 5: Deliver

Commit

bash
/commit "feat: add push notification system"

Agrupa cambios automáticamente por tipo de archivo. Si modificaste código + config + docs, crea commits separados.

bash
/commit "feat(notifications): add daily limit"
bash
/commit "TRV-345 implementar límite diario"
# → feat|TRV-345|20260208|implementar límite diario

Pull Request

bash
/pull-request main

Quality gate integrado que ejecuta en paralelo:

  • Code review (lógica, arquitectura, bugs)
  • Security review (injection, secrets, XSS)
  • Observaciones (tests, API, breaking changes)

Tres opciones: Create PR · Auto fix · Cancel

Post-merge

bash
/branch-cleanup

Elimina feature branch local, sincroniza con remote.


Patrones por tamaño

Small ≤80 LOC — Directo

bash
# Describe y Claude implementa con SDD
"Agrega validación de email en el formulario de registro"

# Commit y PR
/commit "feat: add email validation"
/pull-request main

Sin pipeline. Claude aplica SDD automáticamente (define scenario → satisface → refactoriza).

Medium 80-250 LOC — Brainstorming + Plan Mode + SDD

bash
# 1. Explorar diseño
"Necesito rate limiting en la API"
# → brainstorming → plan mode → aprobación

# 2. Implementar con SDD
"Implementa el diseño"
# → SDD cycle por cada componente

# 3. Entregar
/commit "feat: add API rate limiting"
/pull-request main

Large/XL >250 LOC — Ralph Orchestrator

bash
# 1. Brainstorming (si no hay plan aprobado)
"Necesito autenticación OAuth completa"
# → brainstorming → plan mode → aprobación

# 2. Ralph se encarga de todo
"Implementa con ralph-orchestrator"
# → discovery → planning → tasks → checkpoint
# → ejecución autónoma con commits incrementales

# 3. PR final
/pull-request main

¿Cuándo usar Ralph?

  • Features de más de 250 LOC
  • Desarrollo overnight o AFK
  • Cuando quieres fresh context en cada iteración (evita context rot)
  • Cuando el feature tiene múltiples componentes interdependientes

Hotfix urgente — Worktree aislado

bash
/worktree-create "hotfix-race-condition" main

# En la nueva ventana:
"Fix: race condition en checkout"
/commit "fix: race condition in checkout process"
/pull-request main

/worktree-cleanup hotfix-race-condition

Herramientas de soporte

Además del pipeline principal, el framework incluye herramientas para tareas específicas: /project-init para configurar reglas de proyecto, /deep-research para investigación multi-fuente, agent-browser para interacción web, /dogfood para QA exploratorio de apps web, y /worktree-create para trabajo paralelo.

Ver detalles completos en Skills.


Plugins complementarios

El framework se integra con plugins externos como Superpowers (skills para TDD, planificación estructurada, code review bidireccional, parallel agents) y Episodic Memory (búsqueda semántica de conversaciones pasadas).

Ver instalación y detalles en Integraciones.


Referencia rápida

Quiero...Comando / Acción
Explorar una idea"Necesito X" → brainstorming activa
Desarrollo autónomo"Implementa con ralph-orchestrator"
Investigar sistema existente"Investiga el módulo de auth" → sop-reverse
Debug metódico"Bug: el checkout falla" → systematic-debugging
Commit/commit "tipo: descripción"
Pull request/pull-request main
Limpiar branch/branch-cleanup
Worktree paralelo/worktree-create "nombre" base
Inicializar proyecto/project-init
Investigación profunda/deep-research "tema"
Interacción webagent-browser open URL
QA exploratorio"dogfood localhost:3000" → reporte con repro evidence

Siguiente paso: Pro tips

Relacionados: Skills · Agents · Integrations · Quickstart


Última actualización

Fecha: 2026-03-11