Diagnóstico preciso de fallos en red sin agentes (EJIE)
Tipo de caso
Contexto
EJIE opera infraestructuras TIC críticas (CPDs, red troncal, servicios públicos) con múltiples dominios on-premise y cloud, y necesita detectar y explicar incidencias sin reconfigurar ni instalar agentes.
Problema
- Dificultad para identificar el **punto exacto del fallo** (nodo/enlace) cuando hay degradación (latencia, drops, caídas intermitentes).
- Alertas poco interpretables para perfiles no expertos o equipos externos.
- Demasiado tiempo en correlación manual entre herramientas (SNMP, syslog, tráfico).
Requisitos de integración
- SNMP v2c/v3 en modo lectura.
- NetFlow/IPFIX desde exportadores existentes (o activación mínima en el piloto).
- Syslog desde servidores/relays.
- Inventario / exportación de configuración CLI (sin escritura).
- APIs para integración con monitorización y ticketing.
Solución propuesta
- Ingesta pasiva multifuente (SNMP + NetFlow/IPFIX + syslog + configs + APIs).
- Correlación de eventos para detectar caídas, latencia, drops anómalos y patrones inusuales.
- Visor multicapas en grafo interactivo: marca visual del nodo/enlace problemático (rojo pulsante) y popup contextual con timestamp y explicación adaptada.
- Asistente de diagnóstico: root-cause automatizado y recomendaciones exportables (YAML/JSON) para ejecución posterior en herramientas tipo Ansible/Terraform.
Impacto
- Reducción drástica del tiempo de diagnóstico y del MTTR.
- Menos error humano gracias a explicaciones guiadas y accionables.
- Operación inclusiva: técnicos junior/externos pueden actuar con seguridad.
- Evidencias e informes trazables y auditables (CSV/JSON/YAML + checksum).
Aplicaciones destacadas
- Observabilidad pasiva y correlación de incidentes.
- Asistente virtual de diagnóstico paso a paso.
- Panel de alertas + timeline de eventos + grafo multicapas.