Para poder enviar candidaturas a retos, completa tu perfil de empresa.
Caso de uso

Asistencia conversacional ciudadana multicanal.

Contexto

Problema

Requisitos de integración

Solución propuesta

Impacto

Aplicaciones destacadas

Asistencia conversacional ciudadana multicanal. Real
Los cambios se han guardado correctamente.
Algo ha salido mal, por favor contáctanos en info@opengovtech.es
Caso de uso

Asistencia conversacional ciudadana multicanal.

Tipo de caso

Real

Contexto

El contexto actual exige a las administraciones buscan modernizar sus servicios para responder a sociedades cada vez más digitalizadas, diversas y exigentes. El envejecimiento de la población, la necesidad de inclusión, y la demanda de servicios públicos accesibles 24/7 presionan a las instituciones para repensar sus canales de atención. Al mismo tiempo, hay políticas de digitalización gubernamental y modernización administrativa que promueven el uso de tecnologías para hacer más eficiente la relación con la ciudadanía. En este contexto, la capacidad de ofrecer asistencia automatizada, multicanal, inclusiva —texto, voz o incluso visión— se convierte en una ventaja estratégica para mejorar la accesibilidad, la transparencia y la eficiencia del servicio público.

Problema

No existe una solución estándar que combine accesibilidad, privacidad, robustez frente al ruido o contexto real, y versatilidad multicanal para atender a todos los ciudadanos de forma eficiente.
La diversidad de perfiles de ciudadanía (personas mayores, con discapacidad visual, con barreras lingüísticas) exige soluciones más inclusivas que los medios convencionales. Además, muchos ciudadanos tienen dificultades para utilizar los canales tradicionales de atención (teléfono con tiempos de espera, formularios web complejos, desplazamientos presenciales), lo que genera barreras de acceso e inequidad.
Por otro lado, las administraciones públicas suelen recibir un volumen alto y variable de consultas, lo que dispara los costes de personal, retrasa la respuesta y genera saturación en los canales de atención.

Requisitos de integración

- Infraestructura de hardware. El dimensionamiento de la infraestructura se hará de acuerdo con el número de usuarios y los procesos concretos en cada caso. Como patrón general: En caso de elegir la ejecución local de los modelos de IA, para reducir la latencia es aconsejable disponer de un servidor dedicado con tarjeta gráfica con soporte para librerías CUDA y VRAM suficiente para cargar modelos cuantizados de lenguaje y visión simultáneamente, así como discos SSD NVMe para la carga rápida de contextos y bases de datos vectoriales. El sistema operativo requerido es Linux Ubuntu Server compatible con drivers de NVIDIA y entornos de contenedores. También es posible comenzar con una fase piloto, o una solución final que utilice modelos de IA en la nube. Se elegirá el servicio más adecuado cumpliendo con las normativas éticas, legales y de seguridad. En cualquier caso es recomendable contar con otro servidor de ejecución local, donde se aloja la aplicación principal de la solución. - Software y Despliegue. La solución se entrega paquetizada en contenedores, esto permite aislar el entorno y facilita las actualizaciones. DiViVo expone sus servicios a través de API REST o gRPC para streaming de audio de baja latencia. - Conectividad. Websockets para la transmisión de voz en tiempo real (streaming bidireccional) y Https para el cifrado del tráfico de red. - Back-end. Conexión de lectura a repositorios documentales para indexar normativas y procedimientos, capacidad de conectarse vía APIs (SOAP/REST) a los sistemas de gestión, y autenticación si el sistema lo requiere. - Front-end. Micrófonos con cancelación de ruido y direccionales si es un espacio público y cámaras web estándar si la aplicación lo requiere. El navegador, o la App, debe tener soporte para WebRTC o HTML5 para capturar audio y video desde el navegador sin plugins externos.

Solución propuesta

Plataforma conversacional multimodal: permite interacciones por voz, texto y visión, de modo que ciudadanos puedan comunicarse con la administración usando el medio que les resulte más natural.

Despliegue local con privacidad: la solución puede instalarse “on premises”, lo que evita enviar datos sensibles a la nube, garantizando privacidad y cumplimiento regulatorio.

Diálogo natural, robusto y flexible: utiliza modelos de deep learning capaces de gestionar lenguaje natural real, mejorando la fiabilidad en entornos reales.

Interfaz multiplataforma y accesible: puede integrarse en webs, apps móviles, dispositivos de quiosco, etc., facilitando el acceso desde diversos puntos de contacto.

Atención disponible 24/7, escalable: automatiza respuestas frecuentes, reduciendo carga de trabajo humano, lo que permite atender muchos ciudadanos simultáneamente y con alta disponibilidad.

Impacto

Eficiencia y ahorro de recursos: automatizar consultas frecuentes y trámites básicos reduce la carga al personal administrativo, libera recursos y acelera tiempos de respuesta.

Accesibilidad y equidad:: la interacción en lenguaje natural —voz o texto— hace la experiencia más amigable, inclusiva y cercana, lo que mejora la percepción de la administración.

Resiliencia y escalabilidad: el sistema puede manejar picos de demanda sin necesidad de ampliar plantilla.

Privacidad y confianza: al operar sin subir datos a la nube, minimiza riesgos de fuga de información sensible y cumple con estándares de protección de datos.

Aplicaciones destacadas