La plataforma china de inteligencia artificial DeepSeek no ha tenido suficiente con poner patas arriba a las empresas dominantes de este mercado en el momento que ha irrumpido y ha querido destronarlas, sino que, además, ya ha presentado también un nuevo modelo de IA de generación de imágenes: el Janus Pro 7B.
Englobada dentro de la familia de modelos para crear imágenes, esta tecnología promete superar el rendimiento de aplicaciones conocidas como DALL-E 3 (OpenAI) y Stable Difussion. Así lo parece estar haciendo, según varias comprobaciones desde dentro y fuera de la misma compañía.
Dos en uno
Esta tecnología permite crear imágenes a partir de texto y entender otras que se le introduzcan. Además, se trata de un modelo multimodal, es decir, unifica sus dos comentadas funciones en una única arquitectura.
Se habla de familia de modelos dado que está disponible para su descarga en dos tamaños: con 1.000 millones de parámetros (1B) y con 7.000 millones (7B), pero normalmente, a mayor número de parámetros, más afinadas son sus respuestas.
De código abierto
Sin embargo, la capacidad de entender y generar imágenes con una resolución máxima de 384 x 384 píxeles puede resultar limitada para algunos, aunque el resultado es notable si se compara con las imágenes del modelo anterior al de Janus Pro 7B, las cuales se muestran en la presentación del proyecto de DeepSeek.
Aún más, este está bajo licencia MIT, por lo que se puede modificar y utilizar comercialmente sin restricciones, manteniendo el 'copyright' original y, eso sí, sin utilizarlo para fines militares o de desinformación. Por lo demás, este modelo ya se puede utilizar a través de las plataformas Hugginface y GitHub.