TL;DR: La diferencia entre una imagen IA mediocre y una profesional se reduce a tres factores: un prompt bien estructurado, la herramienta adecuada para tu caso de uso y la disposición a iterar. No necesitas experiencia técnica — necesitas saber cómo hablar con el modelo.
Por qué el prompteo es la clave (no la herramienta)
Uno de los errores más comunes al empezar con generadores de imágenes IA es culpar a la herramienta cuando el resultado es malo. En la mayoría de los casos, el problema está en el prompt.
Un mal prompt: "una mujer bonita en la playa"
Un buen prompt: "portrait of a 30-year-old woman on a Mediterranean beach at golden hour, light summer dress, candid photography, shallow depth of field, Canon 85mm, photorealistic"
El nivel de detalle que aportes al modelo determina directamente la calidad del resultado. Los modelos actuales son extraordinariamente capaces — pero necesitan instrucciones claras.
La estructura del prompt perfecto
Existe una fórmula probada que funciona en Midjourney, DALL-E 3 y Stable Diffusion. No es rígida, pero te da una base sólida:
[SUJETO] + [ESTILO] + [ILUMINACIÓN] + [CÁMARA/PERSPECTIVA] + [AMBIENTE/MOOD]
Sujeto
Describe con precisión qué quieres ver. Incluye edad, género, acción, ropa, expresión si es un personaje. Si es un objeto, especifica materiales, color y forma.
Ejemplo: "una taza de café vintage de cerámica azul con vapor ascendente"
Estilo
Este es el parámetro más impactante. Define el lenguaje visual del resultado. Algunos valores de alto impacto:
photorealistic/cinematic photography→ para realismoconcept art/digital painting→ para arte digitalwatercolor illustration/oil painting→ para estilos artísticosminimalist flat design/isometric illustration→ para diseño gráficoproduct photography→ para e-commerce
Iluminación
La iluminación transforma completamente una imagen. Términos que funcionan:
golden hour→ luz cálida y dramática al atardecersoft box lighting→ luz difusa de estudioneon lighting→ ambiente urbano nocturnobacklit/silhouette→ contraluz dramáticonatural light/window light→ luz suave interior
Cámara y perspectiva
Añadir referencia fotográfica eleva inmediatamente la calidad:
shot on Canon 5D,Hasselblad medium format85mm portrait lens,wide-angle 24mmshallow depth of field,bokehbird's eye view,close-up,wide shot
Ambiente y mood
Las últimas palabras que añades al prompt afectan al "feeling" general:
cinematic,dramatic,ethereal,moodycozy,minimalist,high contrast8k,hyperdetailed,professional
5 tipos de imagen y prompts concretos
1. Fotorrealismo (retratos y personas)
professional portrait of a 40-year-old man, architect,
wearing a white linen shirt, Barcelona studio,
natural window light from the left,
Canon 85mm f/1.4, shallow depth of field,
confident expression, photorealistic
Consejo clave: Especifica siempre la edad aproximada y el tipo de luz. Sin estos dos datos, los resultados son impredecibles.
2. Arte conceptual (fantasía, sci-fi, worldbuilding)
ancient underwater city, bioluminescent coral towers,
schools of exotic fish, god rays from the surface,
concept art style, detailed, cinematic composition,
matte painting, 8k resolution
Consejo clave: Añade concept art o matte painting para ese acabado de preproducción de película o videojuego.
3. Marketing y producto (e-commerce, ads)
minimalist product photography, premium skincare serum bottle,
marble surface, fresh eucalyptus leaves as props,
studio lighting with soft shadows,
white background, commercial photography, ultra-detailed
Consejo clave: white background o studio setup centran el foco en el producto. Añade materiales de props para contextualizar.
4. Ilustración (libros, contenido, redes)
cozy reading nook illustration,
girl with red hair reading a book,
autumn leaves outside the window,
warm candlelight, flat design,
Scandinavian illustration style, soft pastel colors
Consejo clave: Los estilos geográficos o de movimiento artístico (Scandinavian, Japanese, Bauhaus) son señales muy eficientes para el modelo.
5. UI y web (mockups, hero images)
mobile app UI screenshot,
fitness tracking dashboard, dark mode,
clean modern design,
data visualization charts,
gradient purple to blue,
professional mockup on iPhone 15 Pro
Consejo clave: Para UI, incluye siempre el dispositivo y el color mode. Clean, modern y minimal son tus aliados.
Trucos avanzados para usuarios intermedios
Pesos de parámetro (Midjourney)
En Midjourney puedes dar más o menos importancia a partes del prompt con :::
sunset landscape::2 mountains::1 snow — el atardecer tendrá el doble de peso que las montañas.
Para excluir elementos: --no text, watermark, blur
Referencias de imagen
La mayoría de herramientas permiten usar una imagen como referencia de estilo:
- En Midjourney: arrastra la imagen al chat y usa su URL como parte del prompt
- En DALL-E 3: adjunta la imagen en el chat de ChatGPT
- En Stable Diffusion: usa img2img o ControlNet para mantener la composición
Estilos negativos (negative prompts)
En Stable Diffusion, los negative prompts son esenciales:
Negative: blurry, low quality, ugly, deformed, extra limbs, watermark, text
En Midjourney, usa --no [elementos a evitar] al final del prompt.
Iteración sistemática
El método más efectivo no es cambiar todo el prompt de golpe. Cambia un solo elemento, compara el resultado, y sigue ajustando. Piensa en ello como una conversación, no como una orden única.
Herramientas recomendadas por caso de uso
| Caso de uso | Herramienta recomendada | Por qué |
|---|---|---|
| Arte y creatividad | Midjourney v7 | Calidad artística insuperable |
| Integración con textos/ChatGPT | DALL-E 3 | Prompting conversacional |
| Imágenes con texto | Ideogram | Especializado en tipografía |
| Control técnico total | Stable Diffusion | Parámetros ilimitados |
| Diseñadores no técnicos | Canva AI | Integrado en flujo de diseño |
| Presupuesto cero | Adobe Firefly / Leonardo AI | Tier gratuito generoso |
Errores comunes del principiante
Prompts demasiado cortos: "una ciudad futurista" producirá algo genérico. Añade 8-12 descriptores específicos.
Mezclar estilos contradictorios: "fotorrealista y estilo anime" genera resultados inconsistentes. Elige un lenguaje visual dominante.
Ignorar la iluminación: Es el factor que más cambia el resultado final. Siempre especifica la fuente de luz.
No iterar: La primera generación raramente es la definitiva. Usa variaciones, regenera, ajusta.
Olvidar el aspect ratio: Por defecto, la mayoría de herramientas genera cuadrado (1:1). Si necesitas un banner (16:9) o un post de Instagram (4:5), especifícalo desde el principio.
Ir a la herramienta
Preguntas frecuentes
¿Los prompts en español funcionan igual que en inglés? En términos generales, el inglés sigue dando resultados más consistentes en herramientas como Midjourney porque sus modelos fueron entrenados predominantemente en inglés. DALL-E 3 tiene mejor comprensión multilingüe. Mi recomendación práctica: describe el sujeto en español y los términos de estilo e iluminación en inglés. Lo mejor de los dos mundos.
¿Cuántas iteraciones son normales antes de conseguir un buen resultado? Depende del tipo de imagen y tu nivel de exigencia. Para una imagen de marketing comercial, cuenta con 5-15 iteraciones. Para arte conceptual, puede ser 3-5. Para fotorrealismo preciso, a veces más de 20. La clave es cambiar un elemento a la vez para entender qué funciona.
¿Hay alguna forma de mantener el mismo personaje en varias imágenes?
Sí. Midjourney v7 tiene la función --cref (character reference) que mantiene la coherencia facial entre generaciones. Stable Diffusion con LoRA entrenado en fotos específicas también lo logra. DALL-E 3 tiene opciones más limitadas en este aspecto. Para proyectos que requieren personajes consistentes, Midjourney Pro es la opción más práctica actualmente.