En los últimos meses la palabra Transformer ha comenzado a aparecer en secciones de tecnologías, charlas, post tecnológicos debido a la aparición de diferentes aplicaciones basadas en IA como DALL·E 2, IMAGE, ChatGPT o Bard. Estos sistemas utilizan en su mayoría redes de neuronas profundas de tipo Transformer que les permiten extraer información del contexto de las palabras de entrada mediante la utilización de técnicas de atención y auto-atención para generar el resultado.
En esta charla, describiré qué es un Transformer, cómo funciona, cómo podemos construir o reutilizar uno para construir nuestros sistemas de NLP o Visión Artificial y ver como encajan dentro de las arquitecturas de los nuevos sistemas cognitivos que parecen que están revolucionando el mundo de la IA.