Descripción del Puesto
Buscamos un Especialista en Operaciones de Infraestructura de APIs para unirse a nuestro equipo de Middleware. Su misión principal será garantizar la estabilidad, disponibilidad y el rendimiento óptimo de nuestras plataformas de API Management (IBM API Connect, Google Apigee, entre otras).
Este es un rol de misión crítica responsable de la comunicación entre nuestros servicios de APIs de Negocio internas y públicas, operando sobre arquitecturas modernas de contenedores (Kubernetes y OpenShift). Si te apasiona la continuidad operativa, el troubleshooting profundo y los entornos de alta transaccionalidad, este puesto es para ti.
Responsabilidades Principales:
* Gestión Operativa: Ejecutar el mantenimiento preventivo y correctivo de los clústeres de API Connect (v10) On-Premise y/o contenedores y Apigee (Hybrid/Edge).
* Gestión de DataPower Gateway: Administración y configuración de dominios, monitoreo de recursos, Análisis de logs, Gestión de objetos de red.
* Administración de Contenedores: Gestionar el ciclo de vida de los componentes de la plataforma desplegados en Red Hat OpenShift / Kubernetes (escalamiento, revisión de salud de pods y gestión de recursos).
* Continuidad del Servicio: Atención y resolución de incidentes de Nivel 2 y 3, asegurando el cumplimiento de los SLA de disponibilidad.
* Seguridad y Certificados: Gestión de políticas de seguridad, renovación de certificados SSL/TLS y configuración de Cipher Suites en Gateways.
* Actualizaciones y Parcheo: Ejecutar actualizaciones de versión y parches de seguridad en ventanas de mantenimiento programadas.
* Monitoreo Proactivo: Vigilar el performance de la plataforma mediante herramientas de observabilidad (Dynatrace, Grafana, Splunk) para anticipar fallos.
* Documentación: Mantener actualizados los manuales de operación (Runbooks) y realizar análisis de causa raíz (RCA) tras incidentes críticos.
Perfil Técnico Requerido
* Experiencia: Mínimo 3-4 años operando plataformas de API Management (indispensable conocimiento en API Connect y/o Apigee).
* Dominio Datapower Gateway: Experiencia operativa en la gestión de objetos criptográficos (Certificados, Llaves, ValCreds), configuración de Log Targets y troubleshooting avanzado mediante la WebGUI/CLI. Capacidad para diagnosticar fallos de red y latencia directamente en el gateway
* Plataformas de Orquestación: Experiencia sólida en administración operativa de Kubernetes o Red Hat OpenShift (manejo de CLI: kubectl / oc).
* Sistemas Operativos: Dominio de administración de Linux (RHEL).
* Redes: Conocimientos sólidos en protocolo HTTP/S, balanceadores de carga, DNS y gestión de certificados digitales y troubleshooting de fallas de red.
* Herramientas: Manejo de Postman, Git y herramientas de logging (ELK, Dynaytrace, Analytics).
Soft Skills
* Trabajo bajo presión: Capacidad para resolver incidentes críticos en entornos de producción con calma y método.
* Comunicación Asertiva: Habilidad para reportar estatus técnicos a diferentes niveles de la organización.
* Disciplina y Proceso: Apego estricto a las políticas de control de cambios y estándares de seguridad.
* Mentalidad de Servicio: Enfoque proactivo para ayudar a los equipos de desarrollo a resolver problemas de conectividad y operativos.
Deseable:
* Certificaciones oficiales en IBM API Connect, Google Apigee o Red Hat (EX280).
* Conocimientos en automatización con Ansible o Python.
* Inglés técnico (lectura de documentación y soporte con fabricantes).