Diffusion VS Autoregresión

Entradas Archivos Wallpaper Problemas

Generar Imágenes

El problema de generar imágenes puede ser reducido a un problema de predicción. Primero se tiene que encontrar una manera de introducir los datos al modelo, pues si solo se introducen imágenes con una etiqueta el modelo generará un promedio de todas las imágenes con la misma etiqueta, es decir una imagen la cual cada píxel de esta imagen es el promedio de los demás píxeles que se encuentran en esa misma posición en las otras imágenes.

Autorregresión

El algoritmo de Autorregresión en la generación de imágenes consiste en dada una secuencia de píxeles intentar predecir el siguiente o los siguientes N píxeles.

Esta solución tiene varias desventajas:

Diffusion

Un modelo de Diffusion toma una imagen de ruido y en lugar de agregar información, elimina información del ruido.

Cuando estos modelos se entrenan, se tiene una imagen y se le agrega “ruido”, la forma de generar este ruido es la que aprenden los modelos de generación. Para después dada una imagen de ruido, este proceso pueda ser invertido, eliminando el ruido en cada iteración y por lo tanto generando una imagen coherente.

Fuente

(Why Does Diffusion Work Better than Auto-Regression?)[https://www.youtube.com/watch?v=zc5NTeJbk-k]