Introducción a las funciones de Midjourney V6 y métodos de uso de v6

29 de enero de 2023 Documentación

MidJourney lanzó su último modelo básico de generación de imágenes por IA, el modelo V6, el 21 de diciembre. Este modelo cuenta con mayor precisión en los prompts, mejor consistencia y capacidades de generación de texto mejoradas. El modelo V6 se posiciona como una mejora significativa respecto al modelo anterior, el V5.2. Una característica notable del modelo V6 es su capacidad para generar texto, lo que permite a MidJourney competir con otros modelos líderes como DaLL-E 3 e Ideogram.

¿Qué funciones tiene MidJourney V6?

MidJourney ha realizado varias mejoras y añadido nuevas funciones:

1. Mejora de la calidad de la imagen: La versión V6 ha dado un salto cualitativo en el estilo realista. Si bien la versión 5.2 era bastante buena en este aspecto, aún se notaba cierto “sabor” de IA. A partir de la versión V6, la calidad de la imagen será más realista. A continuación, comparo las versiones V5.2 y V6:

Prompt: Genera un retrato de alta costura de una mujer, con su maquillaje, peinado y vestuario enfatizando elegancia y atractivo. La iluminación debe resaltar sus características y el entorno debe exudar lujo y sofisticación.

2. Mejora en la comprensión semántica: La versión V6 tiene una mejor comprensión de las palabras clave. Palabras que se usaban frecuentemente como HD, UHD, realista, etc., ya no son necesarias en la versión V6. Solo necesitas describir lo que quieres decir. (Ejemplo: Un niño pequeño está comiendo una manzana verde, y también hay dos manzanas rojas y un coche de juguete en la mesa)

Se puede ver que la capacidad de comprensión de texto de la versión V6 ha mejorado significativamente. En la imagen 2, los colores y la cantidad de manzanas coinciden, lo que reduce considerablemente la frecuencia de “tirar la carta”.

3. Función de añadir texto a la imagen: Este ha sido un problema sin resolver desde el lanzamiento de MidJourney en 2022, mientras que competidores como DALL-E 3 e Ideogram ya han lanzado esta función. Aunque la función oficial se describe como una capacidad de generación de texto ligera, ya es bastante impresionante. Ahora puedes agregar elementos de texto a la imagen escribiendo el texto deseado entre comillas y ajustando la configuración de estilo.

Prompt: imagina una foto del texto “Midjourney V6” escrito con un marcador en una nota adhesiva –ar 16:9 –v 6

Además, la versión V6 ha mejorado la representación de las manos de las personas, e incluye varias otras funciones como ajustes de relación de aspecto, modo caótico, modo extraño, modo mosaico, varios estilos y mezcla de imágenes. Sin embargo, algunas funciones como el paneo, zoom, cambios parciales y la versión actualizada de la función “/describe” se lanzarán en futuras actualizaciones.

¿Cómo habilitar la versión MidJourney V6?

La versión V6 aún está en fase de pruebas, y por defecto se usa la versión V5.2. La actualización no se aplicará automáticamente, por lo que los usuarios deben escribir el comando de barra diagonal “/settings” en el servidor de Discord de MidJourney o en un mensaje directo, y luego seleccionar V6 en el menú desplegable superior. Alternativamente, se puede usar el método antiguo, ingresando manualmente “–v 6” después del prompt.

Nota: GPTBiz ya ha ajustado la versión predeterminada a V6. Si necesitas usar la versión 5.2, solo debes añadir –v 5.2 al final del prompt.

Fuente: Midjourney V6 功能介绍以及 v6 的使用方法

Equipo GPTBiz

29 de diciembre de 2023

Tutorial