Las 5 capacidades que diferencian un Ingeniero de Prompts senior de uno mid

📅 Publicado 2 may 2026 ⏱ Lectura ~14 min 🔧 Por operadores, no reseñadores

"Senior" es la palabra más sobreutilizada en perfiles de Ingeniero de Prompts. En LinkedIn, todo el que diseñó 3 prompts para ChatGPT se autoproclama senior. Para un CTO o director de RRHH evaluando contrataciones, esto es ruido peligroso: contratar a un "senior" que en realidad es mid-level cuesta 12-18 meses de retraso + el costo de oportunidad del trabajo no hecho. Estas son las 5 capacidades reales que diferencian un Ingeniero de Prompts senior de uno mid — con la pregunta de entrevista que las verifica.

Por qué la diferencia importa más en este rol que en otros

En desarrollo de software tradicional, contratar mid-level cuando se necesitaba senior se nota a los 6-9 meses (código que escala mal, decisiones arquitectónicas dudosas). En Ingeniería de Prompts, la diferencia se nota mucho más rápido — y duele mucho más:

Por eso la verificación de las 5 capacidades es no-negociable en cualquier proceso de contratación serio.

Capacidad 1 — Diseño estructural de prompts

Qué es: aplicar consistentemente los 7 elementos canónicos (rol, contexto, tarea, formato, restricciones, few-shot, variables) sin pensarlo. No es seguir una checklist — es saber cuándo cada elemento aplica, cuándo se puede omitir, cuándo se debe enfatizar.

Diferencia mid vs senior: el mid-level conoce los 7 elementos cuando se los muestran. El senior los aplica orgánicamente y sabe cuándo el prompt requiere variantes (ej: prompt en inglés para un modelo que responde mejor a markdown vs prompt en español con XML tags para Claude).

Pregunta de entrevista"Mostrame un prompt que diseñaste para producción. Caminame por cada elemento del prompt y por qué lo pusiste o lo dejaste fuera." — Senior responde con racional para cada decisión. Mid responde con "así suele funcionar" o "copié esa estructura de un ejemplo".

Capacidad 2 — Testing sistemático con casos representativos + adversariales

Qué es: diseñar un dataset de testing que cubre representativos (~70%), edge (~20%) y adversariales (~10%). Definir métricas de éxito antes de testear. Iterar el prompt según los errores observados, midiendo en cada iteración. Saber distinguir entre un prompt que está "bien" y un prompt que está "listo para producción".

Diferencia mid vs senior: el mid prueba 3-5 inputs típicos y declara el prompt listo. El senior tiene un dataset de 20-30 casos versionado, métricas claras, y puede mostrar la curva de mejora del prompt entre iteraciones.

Pregunta de entrevista"Mostrame el dataset de testing que usaste para validar tu último prompt. ¿Cuántos casos? ¿Cómo definiste 'correcto' para cada uno? ¿Cuál fue el % final?" — Senior tiene un Excel/notebook con todo. Mid responde "lo probé varias veces, andaba bien".

Capacidad 3 — Integración técnica con APIs y workflow tools

Qué es: conocer las APIs de los 3-4 modelos frontier (OpenAI, Anthropic, Google), entender diferencias de pricing (input vs output tokens, caching), saber cuándo usar streaming vs batch, conectar con workflow tools (n8n, Zapier, Make) y backend stacks (Node, Python, Ruby), implementar manejo de errores serio (retries, fallbacks entre modelos, validación de output con regex/JSON schema).

Diferencia mid vs senior: el mid sabe hacer un curl a la API de OpenAI y parsear el JSON. El senior conoce token limits, rate limits, costo comparado de modelos para la misma tarea, sabe cuándo usar prompt caching para bajar 50%+ del costo, y diseña el sistema asumiendo que cualquier provider puede caer.

Pregunta de entrevista"Tu prompt corre en producción y de repente la API de Anthropic devuelve 500 por 30 minutos. ¿Cómo está diseñado tu sistema para manejar eso?" — Senior describe fallback automático a otro provider, retries con exponential backoff, alertas, y posible degradación graceful (output más simple si fallback no disponible). Mid dice "reintentamos" o "sería problema".

Capacidad 4 — Conocimiento del negocio del cliente

Qué es: sentarse con operaciones, ventas, producto. Entender el flujo de trabajo donde el prompt va a vivir. Saber qué casos edge ocurren en realidad en esa empresa específica (no en teoría). Hablar el vocabulario interno del cliente. Identificar cuándo el problema no es de prompt sino de proceso.

Diferencia mid vs senior: esta es la capacidad que más diferencia senior de mid sin ambigüedad. El mid escribe prompts en abstracto — el output es técnicamente correcto pero no encaja en el flujo real. El senior pasa la primera semana de cualquier proyecto sentándose con quien va a usar el output, entendiendo el contexto, antes de escribir una línea de prompt.

Esta capacidad no se mide con preguntas de teoría. Se mide observando cómo el candidato hace preguntas sobre tu negocio durante la entrevista. ¿Pregunta sobre tu vertical, tu cliente final, tu volumen real? Senior. ¿Asume que tu caso es similar a otro genérico que vio? Mid.

Pregunta de entrevistaContale al candidato un proceso de tu empresa donde quisieras aplicar IA. Pedile que te haga 10 preguntas sobre el proceso antes de proponer el prompt. — Senior hace preguntas sobre operación real (volumen, frecuencia, qué pasa si falla, quién usa el output, vocabulario interno). Mid pregunta cosas técnicas (qué modelo, qué API, qué formato). Las dos son válidas, pero el orden importa.

Capacidad 5 — Documentación de mantenimiento

Qué es: entregar no solo el prompt sino el manual: qué hace, qué inputs espera, qué outputs produce, cómo testearlo, qué métricas monitorear, qué cambiar si baja el % de aciertos en producción, qué optimizar si la empresa migra entre modelos. Pensar en el desarrollador o operador que va a tocar este prompt en 18 meses sin contexto.

Diferencia mid vs senior: el mid entrega el prompt y se va. Si después surge un problema, hay que llamarlo (y si no está disponible, nadie sabe qué hacer). El senior entrega el prompt + el manual + el dataset de testing + el changelog + las métricas baseline. La empresa puede operar el prompt sin él.

Esta capacidad parece "nice to have" pero es la que separa un proyecto que se sostiene 3 años de uno que se rompe a los 6 meses cuando el primer modelo cambia o el primer caso edge nuevo aparece.

Pregunta de entrevista"Mostrame la documentación operativa del último prompt que pusiste en producción. Quiero ver el manual que un operador externo usaría para mantener ese prompt sin hablar con vos." — Senior tiene un README estructurado, dataset de pruebas comentado, métricas en docs, troubleshooting common issues. Mid tiene el prompt en un Notion sin contexto, o nada.

Cómo verificar las 5 en una sola entrevista de 90 minutos

Estructura que recomendamos para evaluar las 5 capacidades en una sola sesión:

BloqueTiempoCapacidad evaluada
1. Walk-through del último proyecto del candidato20 min1, 2, 5 (le pedís ver prompt + dataset + docs)
2. Caso técnico: "tu prompt en producción tiene problema X, ¿cómo lo diagnosticás?"20 min3 (integración técnica + observability)
3. Caso de negocio: "acá hay un proceso de mi empresa, ¿cómo lo abordás?"30 min4 (cómo pregunta + cómo piensa el problema)
4. Q&A del candidato hacia vos15 min4 + cultural fit
5. Decisión: ¿senior real o mid pretendiendo?5 minintegración de todo lo anterior

El bloque más informativo suele ser el 4: las preguntas que el candidato hace al final dicen muchísimo de cómo va a operar dentro de la empresa.

El test rápido: 1 pregunta para descartar mid pretendiendo ser senior

Si tenés 5 minutos, no 90: hacé esta única pregunta y observá la respuesta.

"Contame un caso donde un prompt que diseñaste falló en producción. ¿Cómo te enteraste? ¿Cómo lo arreglaste? ¿Qué cambiaste en tu metodología después de esa experiencia?"

Senior responde con un caso concreto, métricas, qué aprendió, qué cambió en su proceso. Tiene cicatrices y las usa para mejorar.

Mid responde "no me pasó nunca" (mentira o no operó en producción seria), o "el cliente cambió de opinión y entonces…" (no es falla del prompt, es excusa).

¿Estás evaluando contratar un Ingeniero de Prompts?

Si necesitás ayuda evaluando candidatos, o querés conocer cómo trabaja un Ingeniero dedicado vía agencia (alternativa a contratación interna), conversemos 30 minutos sin compromiso.

Hablar por WhatsApp

Preguntas frecuentes

¿Cuántos Ingenieros de Prompts senior reales hay en Chile en 2026?

Por nuestra estimación basada en mercado activo: menos de 80 personas en Chile cumplen las 5 capacidades a nivel senior (3+ años, casos B2B documentados, 5+ proyectos en producción exitosos). Eso explica los rangos salariales (CLP 2,8-4,5M/mes + bonos) y la dificultad de contratar interno. La oferta es chica, la demanda creciente, los precios suben.

¿Un Ingeniero de Prompts senior es lo mismo que un Data Scientist o ML Engineer?

No, son roles distintos. Data Scientist trabaja con datos estructurados, modelos predictivos, estadística. ML Engineer construye y deploya modelos. Ingeniero de Prompts diseña la interfaz lingüística entre el negocio y los LLMs frontier — no entrena modelos, pero sabe extraerles el máximo. Hay overlap en testing y métricas, pero el día a día es muy diferente. Algunos ML Engineers transicionan a Prompt Engineer; los mejores lo hacen porque combinan rigor técnico con sensibilidad lingüística.

¿Cómo evalúo si necesito senior real o me alcanza con mid?

Mid alcanza si: 1) los prompts son para uso interno bajo riesgo (resumir reuniones, generar drafts), 2) hay alguien senior supervisando (interno o agencia), 3) podés permitirte 6-12 meses de aprendizaje en el rol. Senior necesario si: 1) los prompts van a producción con consecuencias reales (financiero, legal, atención cliente B2C), 2) no tenés supervisión senior disponible, 3) el negocio depende de que el primer prompt en producción funcione bien desde el día 1.

¿Qué pasa si contrato senior y a los 12 meses se quiere ir?

En este mercado, asumí que un senior va a recibir ofertas mejores cada 12-18 meses. Estrategias: 1) Documentación obligatoria desde día 1 (el conocimiento debe vivir en docs accesibles, no solo en su cabeza), 2) Plan de retención claro (compensación competitiva, autonomía técnica, proyectos interesantes), 3) Pipeline de mid que aprenden bajo el senior (cuando el senior se va, el mid puede asumir parcialmente), 4) Considerar modalidad dedicated via agencia como hedge — la persona puede cambiar pero la agencia mantiene continuidad.

¿Las 5 capacidades aplican igual para freelance, dedicated y interno?

Sí, las capacidades son las mismas. La diferencia es cómo se aplican según el modelo: el freelance las aplica a múltiples clientes en paralelo (depth ≤ vs interno). El dedicated las aplica a una sola empresa por bloques de tiempo significativos (depth alto). El interno las aplica con integración total al día a día de la empresa (depth máximo, breadth bajo). Para cada modelo evaluá las mismas 5 — varía solo el contexto donde se aplican.