---
name: pipeline-ground-truth
description: "FASE 2 — GroundTruthAgent. Documenta supuestos base clasificados (confirmado/estimación/pendiente)."
---

# Pipeline Ground Truth — GroundTruthAgent

## Input

| Archivo | Descripción |
|---------|-------------|
| `BRIEF.json` | Brief de la Fase 1 |

## Output

`projects/{proyecto}/v{n}/GROUND-TRUTH.json` con supuestos clasificados ✅/⚠️/❓.

Categorías:
1. Supuestos de Mercado (tamaño, segmento, tendencia)
2. Supuestos de Producto/Servicio (precio, coste, volumen)
3. Supuestos de Costes (fijos, inversión, CAC)
4. Supuestos de Ventas (timeline, crecimiento, LTV)
5. Datos Reales (si negocio existe: revenue, clientes, ticket medio)

Cada supuesto: `{ valor, fuente, estado: "✅"|"⚠️"|"❓" }`

## Frameworks

- Business Plan Validation — Problem-Solution Fit
- Financial Modeling — unit economics assumptions

## Prompt Guía

```
Lee projects/{proyecto}/v{n}/BRIEF.json y genera el Ground Truth.

Crea un documento con 5 categorías de supuestos:
1. Supuestos de Mercado (tamaño, segmento, tendencia)
2. Supuestos de Producto/Servicio (precio, coste, volumen)
3. Supuestos de Costes (fijos, inversión, CAC)
4. Supuestos de Ventas (timeline, crecimiento, LTV)
5. Datos Reales (si el negocio existe: revenue, clientes, ticket medio, estacionalidad)
6. **Estacionalidad Local** (OBLIGATORIO): ¿La ciudad es turística o emisora? ¿Se vacía en verano? Buscar datos INE de población de hecho vs derecho. NO asumir patrones genéricos — cada ciudad tiene su propia estacionalidad.

Cada supuesto tiene: valor, fuente, estado (✅/⚠️/❓)

Si el negocio ya existe, los datos históricos SON el ground truth.

### Análisis de Competencia con Reseñas Reales (OBLIGATORIO)

Para cada competidor identificado:
1. Extraer reseñas de Google Maps usando el script de Extractor:
   ```
   xvfb-run -a --server-args="-screen 0 1920x1080x24" python3 ~/.openclaw/workspace/agents/extractor/skills/google-reviews-extract/google_reviews_camoufox.py "Nombre Competidor" "Ciudad" --max 10
   ```
2. Datos societarios del competidor (registro-empresas-es):
   ```
   # Buscar en Infocif, LibreBOR, etc.
   # Ver skills/registro-empresas-es/SKILL.md
   # Útil para: CIF, fecha constitución, administradores, capital social, estado
   ```
3. Incluir en GROUND-TRUTH.json los datos extraídos:
   - `rating_google_maps`: nota media
   - `total_reviews_google_maps`: total de reseñas
   - `reviews_sample`: array con las reseñas extraídas (autor, rating, fecha, texto)
   - `insights_competencia`: análisis cualitativo (fortalezas, debilidades, quejas recurrentes)
   - `datos_societarios`: CIF, administradores, estado, capital (si disponible)
4. Fuentes adicionales para reseñas (si Google Reviews falla):
   - TripAdvisor: scraping con fallback chain
   - SearXNG: `python3 skills/searxng-search/searxng-search.py "[competidor] review [ciudad]"`
   - Reddit: `node skills/reddit-readonly/reddit-readonly.mjs "[competidor] [ciudad]"`
   - Foros sectoriales (Escapistas.CLUB, TodoEscapeRooms, etc.)
5. NO inventar reseñas ni puntuaciones — solo datos extraídos

Guarda como GROUND-TRUTH.json en projects/{proyecto}/v{n}/
```

## Duración Estimada

~45 segundos

## Variables Clave

- Supuestos críticos en ❓ → detener pipeline, preguntar a el usuario
- Al menos precio, coste y mercado objetivo en ✅ o ⚠️ antes de avanzar