Las 5 capacidades que diferencian un Ingeniero de Prompts senior de uno mid
"Senior" es la palabra más sobreutilizada en perfiles de Ingeniero de Prompts. En LinkedIn, todo el que diseñó 3 prompts para ChatGPT se autoproclama senior. Para un CTO o director de RRHH evaluando contrataciones, esto es ruido peligroso: contratar a un "senior" que en realidad es mid-level cuesta 12-18 meses de retraso + el costo de oportunidad del trabajo no hecho. Estas son las 5 capacidades reales que diferencian un Ingeniero de Prompts senior de uno mid — con la pregunta de entrevista que las verifica.
Por qué la diferencia importa más en este rol que en otros
En desarrollo de software tradicional, contratar mid-level cuando se necesitaba senior se nota a los 6-9 meses (código que escala mal, decisiones arquitectónicas dudosas). En Ingeniería de Prompts, la diferencia se nota mucho más rápido — y duele mucho más:
- Un mid-level diseña prompts que funcionan en demo y se rompen en producción. La empresa lo descubre cuando un cliente reporta el primer error grave.
- El "fix rápido" del mid-level suele ser agregar más restricciones al prompt — que termina rompiendo otros casos.
- El mid-level no documenta. Cuando se va o lo asignan a otro proyecto, el prompt vive en una caja negra que nadie quiere tocar.
- El mid-level no sabe testear adversarialmente. El primer prompt injection en producción es noticia interna.
Por eso la verificación de las 5 capacidades es no-negociable en cualquier proceso de contratación serio.
Capacidad 1 — Diseño estructural de prompts
Qué es: aplicar consistentemente los 7 elementos canónicos (rol, contexto, tarea, formato, restricciones, few-shot, variables) sin pensarlo. No es seguir una checklist — es saber cuándo cada elemento aplica, cuándo se puede omitir, cuándo se debe enfatizar.
Diferencia mid vs senior: el mid-level conoce los 7 elementos cuando se los muestran. El senior los aplica orgánicamente y sabe cuándo el prompt requiere variantes (ej: prompt en inglés para un modelo que responde mejor a markdown vs prompt en español con XML tags para Claude).
Capacidad 2 — Testing sistemático con casos representativos + adversariales
Qué es: diseñar un dataset de testing que cubre representativos (~70%), edge (~20%) y adversariales (~10%). Definir métricas de éxito antes de testear. Iterar el prompt según los errores observados, midiendo en cada iteración. Saber distinguir entre un prompt que está "bien" y un prompt que está "listo para producción".
Diferencia mid vs senior: el mid prueba 3-5 inputs típicos y declara el prompt listo. El senior tiene un dataset de 20-30 casos versionado, métricas claras, y puede mostrar la curva de mejora del prompt entre iteraciones.
Capacidad 3 — Integración técnica con APIs y workflow tools
Qué es: conocer las APIs de los 3-4 modelos frontier (OpenAI, Anthropic, Google), entender diferencias de pricing (input vs output tokens, caching), saber cuándo usar streaming vs batch, conectar con workflow tools (n8n, Zapier, Make) y backend stacks (Node, Python, Ruby), implementar manejo de errores serio (retries, fallbacks entre modelos, validación de output con regex/JSON schema).
Diferencia mid vs senior: el mid sabe hacer un curl a la API de OpenAI y parsear el JSON. El senior conoce token limits, rate limits, costo comparado de modelos para la misma tarea, sabe cuándo usar prompt caching para bajar 50%+ del costo, y diseña el sistema asumiendo que cualquier provider puede caer.
Capacidad 4 — Conocimiento del negocio del cliente
Qué es: sentarse con operaciones, ventas, producto. Entender el flujo de trabajo donde el prompt va a vivir. Saber qué casos edge ocurren en realidad en esa empresa específica (no en teoría). Hablar el vocabulario interno del cliente. Identificar cuándo el problema no es de prompt sino de proceso.
Diferencia mid vs senior: esta es la capacidad que más diferencia senior de mid sin ambigüedad. El mid escribe prompts en abstracto — el output es técnicamente correcto pero no encaja en el flujo real. El senior pasa la primera semana de cualquier proyecto sentándose con quien va a usar el output, entendiendo el contexto, antes de escribir una línea de prompt.
Esta capacidad no se mide con preguntas de teoría. Se mide observando cómo el candidato hace preguntas sobre tu negocio durante la entrevista. ¿Pregunta sobre tu vertical, tu cliente final, tu volumen real? Senior. ¿Asume que tu caso es similar a otro genérico que vio? Mid.
Capacidad 5 — Documentación de mantenimiento
Qué es: entregar no solo el prompt sino el manual: qué hace, qué inputs espera, qué outputs produce, cómo testearlo, qué métricas monitorear, qué cambiar si baja el % de aciertos en producción, qué optimizar si la empresa migra entre modelos. Pensar en el desarrollador o operador que va a tocar este prompt en 18 meses sin contexto.
Diferencia mid vs senior: el mid entrega el prompt y se va. Si después surge un problema, hay que llamarlo (y si no está disponible, nadie sabe qué hacer). El senior entrega el prompt + el manual + el dataset de testing + el changelog + las métricas baseline. La empresa puede operar el prompt sin él.
Esta capacidad parece "nice to have" pero es la que separa un proyecto que se sostiene 3 años de uno que se rompe a los 6 meses cuando el primer modelo cambia o el primer caso edge nuevo aparece.
Cómo verificar las 5 en una sola entrevista de 90 minutos
Estructura que recomendamos para evaluar las 5 capacidades en una sola sesión:
| Bloque | Tiempo | Capacidad evaluada |
|---|---|---|
| 1. Walk-through del último proyecto del candidato | 20 min | 1, 2, 5 (le pedís ver prompt + dataset + docs) |
| 2. Caso técnico: "tu prompt en producción tiene problema X, ¿cómo lo diagnosticás?" | 20 min | 3 (integración técnica + observability) |
| 3. Caso de negocio: "acá hay un proceso de mi empresa, ¿cómo lo abordás?" | 30 min | 4 (cómo pregunta + cómo piensa el problema) |
| 4. Q&A del candidato hacia vos | 15 min | 4 + cultural fit |
| 5. Decisión: ¿senior real o mid pretendiendo? | 5 min | integración de todo lo anterior |
El bloque más informativo suele ser el 4: las preguntas que el candidato hace al final dicen muchísimo de cómo va a operar dentro de la empresa.
El test rápido: 1 pregunta para descartar mid pretendiendo ser senior
Si tenés 5 minutos, no 90: hacé esta única pregunta y observá la respuesta.
"Contame un caso donde un prompt que diseñaste falló en producción. ¿Cómo te enteraste? ¿Cómo lo arreglaste? ¿Qué cambiaste en tu metodología después de esa experiencia?"
Senior responde con un caso concreto, métricas, qué aprendió, qué cambió en su proceso. Tiene cicatrices y las usa para mejorar.
Mid responde "no me pasó nunca" (mentira o no operó en producción seria), o "el cliente cambió de opinión y entonces…" (no es falla del prompt, es excusa).
¿Estás evaluando contratar un Ingeniero de Prompts?
Si necesitás ayuda evaluando candidatos, o querés conocer cómo trabaja un Ingeniero dedicado vía agencia (alternativa a contratación interna), conversemos 30 minutos sin compromiso.
Hablar por WhatsAppPreguntas frecuentes
¿Cuántos Ingenieros de Prompts senior reales hay en Chile en 2026?
Por nuestra estimación basada en mercado activo: menos de 80 personas en Chile cumplen las 5 capacidades a nivel senior (3+ años, casos B2B documentados, 5+ proyectos en producción exitosos). Eso explica los rangos salariales (CLP 2,8-4,5M/mes + bonos) y la dificultad de contratar interno. La oferta es chica, la demanda creciente, los precios suben.
¿Un Ingeniero de Prompts senior es lo mismo que un Data Scientist o ML Engineer?
No, son roles distintos. Data Scientist trabaja con datos estructurados, modelos predictivos, estadística. ML Engineer construye y deploya modelos. Ingeniero de Prompts diseña la interfaz lingüística entre el negocio y los LLMs frontier — no entrena modelos, pero sabe extraerles el máximo. Hay overlap en testing y métricas, pero el día a día es muy diferente. Algunos ML Engineers transicionan a Prompt Engineer; los mejores lo hacen porque combinan rigor técnico con sensibilidad lingüística.
¿Cómo evalúo si necesito senior real o me alcanza con mid?
Mid alcanza si: 1) los prompts son para uso interno bajo riesgo (resumir reuniones, generar drafts), 2) hay alguien senior supervisando (interno o agencia), 3) podés permitirte 6-12 meses de aprendizaje en el rol. Senior necesario si: 1) los prompts van a producción con consecuencias reales (financiero, legal, atención cliente B2C), 2) no tenés supervisión senior disponible, 3) el negocio depende de que el primer prompt en producción funcione bien desde el día 1.
¿Qué pasa si contrato senior y a los 12 meses se quiere ir?
En este mercado, asumí que un senior va a recibir ofertas mejores cada 12-18 meses. Estrategias: 1) Documentación obligatoria desde día 1 (el conocimiento debe vivir en docs accesibles, no solo en su cabeza), 2) Plan de retención claro (compensación competitiva, autonomía técnica, proyectos interesantes), 3) Pipeline de mid que aprenden bajo el senior (cuando el senior se va, el mid puede asumir parcialmente), 4) Considerar modalidad dedicated via agencia como hedge — la persona puede cambiar pero la agencia mantiene continuidad.
¿Las 5 capacidades aplican igual para freelance, dedicated y interno?
Sí, las capacidades son las mismas. La diferencia es cómo se aplican según el modelo: el freelance las aplica a múltiples clientes en paralelo (depth ≤ vs interno). El dedicated las aplica a una sola empresa por bloques de tiempo significativos (depth alto). El interno las aplica con integración total al día a día de la empresa (depth máximo, breadth bajo). Para cada modelo evaluá las mismas 5 — varía solo el contexto donde se aplican.