Cargando Eventos
Modelos de lenguaje LLM Como controlar tu modelo Interpretabilidad mecanicista, restricciones neuro-simbólicas y guardarraíles

Cómo controlar tu modelo: interpretabilidad mecanicista, restricciones neuro-simbólicas y guardarraíles

Cuando un modelo de lenguaje pasa a producción, el desafío ya no consiste únicamente en obtener buenas respuestas, sino en garantizar que el sistema actúe de forma segura, fiable y predecible. En esta Expert Talk en el Madrid Innovation Lab, exploraremos algunos de los enfoques más avanzados para controlar el comportamiento de sistemas basados en inteligencia artificial.

La sesión abordará cómo ir más allá del prompting y el fine-tuning para construir mecanismos de supervisión y control robustos en entornos reales. Una conversación especialmente relevante en un momento en el que los modelos generativos empiezan a integrarse en procesos críticos dentro de empresas y organizaciones.

Qué podrás aprender

Durante la charla se analizarán distintos enfoques para mejorar la seguridad y gobernanza de sistemas basados en LLMs:

  • Las principales amenazas asociadas al despliegue de modelos en producción:
    alucinaciones, filtración de datos o jailbreaks.
  • Cómo diseñar sistemas de evaluación que permitan equilibrar seguridad y utilidad.
  • Estrategias de control arquitectónico y uso de guardarraíles en diferentes capas del sistema.
  • Técnicas neuro-simbólicas que combinan redes neuronales con reglas verificables.
  • Introducción a la interpretabilidad mecanicista, utilizada en laboratorios avanzados como Anthropic para mejorar la observabilidad y el control interno de los modelos.

La sesión incluirá ejemplos prácticos y una visión aplicada sobre cómo combinar estos enfoques para construir sistemas de IA más robustos y confiables.

Ponente

La charla estará impartida por Alberto Sánchez Pérez, Científico de Datos Senior en Kyndryl, especializado en inteligencia artificial y sistemas avanzados de aprendizaje automático.

Al finalizar la sesión habrá un espacio de networking para intercambiar ideas y preguntas entre asistentes.

¡Apúntatelo en la agenda!

📅 Fecha: lunes, 1 de junio de 2026

 Horario: 18:30 – 20:00 h.

📍 Ubicación: Madrid Innovation Lab (MIL). C/ Bravo Murillo 37-39