28 abril, 2024

Juanfe Serrano | Apple presentó MGIE, una IA capaz de diseñar imágenes con solo una frase

Juanfe Serrano - Apple presentó MGIE, una IA capaz de diseñar imágenes con solo una frase - FOTO

DAT.- El gigante tecnológico Apple presentó recientemente MGIE, una innovación en Inteligencia Artificial (IA) de uso libre que permite modificar imágenes mediante simples instrucciones escritas. Este avance se logró gracias al trabajo conjunto con la Universidad de California en Santa Bárbara.

Explica Juanfe Serrano que el sistema de Apple se basa en lo que se llama ‘edición de imágenes guiada’. Esto significa que, por medio de tecnologías avanzadas capaces de entender texto e imágenes (conocidas como modelos de lenguaje grande multimodal), MGIE puede interpretar lo que una persona solicita y cambiar una imagen en detalle, pixel por pixel.

Por ejemplo, si el usuario le pide a la IA que haga el cielo más azul en una fotografía, MGIE entenderá esta instrucción y modificará la imagen para cumplir con el pedido.

Contenido

Cómo trabaja MGIE

Los investigadores explican que a veces las instrucciones que las personas dan son muy cortas y directas, lo que dificulta su comprensión por los sistemas actuales. No obstante, los modelos de lenguaje grande que entienden tanto texto como imágenes (Mllm) muestran gran potencial para interpretar y responder a estas instrucciones mediante la edición visual. MGIE, el método desarrollado, trabaja de dos maneras con estos Mllm. Primero, toma las instrucciones escritas por el usuario y las traduce en comandos más detallados y específicos que facilitan la edición.

Por ejemplo, si alguien quiere que el pasto de una foto luzca más verde, MGIE podría entender esto como aumentar un 20% la saturación de verde en el área correspondiente al pasto. Este comando claro es el que se utiliza para editar la imagen. Luego, en un segundo paso, usa estos modelos avanzados para generar una idea visual precisa de cómo debería verse la edición final.

LEA TAMBIÉN | Juanfe Serrano | Facebook está de aniversario: ¡Se cumplen 20 años de la creación de la red social más grande del mundo!

Este proceso crea una guía para ajustar la imagen, modificando cada píxel según sea necesario. Así, MGIE puede realizar cambios específicos en instrucciones muy breves o ambiguas sin necesitar mucha información adicional y brindar resultados que satisfacen lo pedido por el usuario.

Según los creadores, este sistema mejora significativamente la precisión de las ediciones y la satisfacción de los usuarios, manteniendo un proceso rápido y eficiente.

(Con información de Juanfe Serrano)