Buscamos uma pessoa para atuar como Senior DevOps / SRE Engineer, combinando desenvolvimento de software com excelência operacional e confiabilidade de plataformas.
Essa pessoa terá atuação transversal entre múltiplos times, apoiando a evolução de ambientes cloud-native, automação, observabilidade e práticas de Site Reliability Engineering (SRE).
O desafio envolve construir soluções escaláveis, resilientes e self-service, garantindo eficiência operacional e experiência consistente para os times de desenvolvimento.
Responsabilidades
Atuar de forma cross-team apoiando squads na resolução de problemas de confiabilidade, performance e arquitetura.
Identificar gargalos e atuar preventivamente para evitar incidentes em produção.
Desenvolver ferramentas internas, serviços e CLI’s para abstrair a complexidade da nuvem, Kubernetes e Azure Container Apps.
Projetar e evoluir Golden Paths para deploys seguros, escaláveis e self-service.
Implementar e evoluir práticas de SRE como SLI, SLA, SLO, Error Budgets e observabilidade.
Atuar em incidentes críticos realizando troubleshooting, análise de causa raiz e definição de ações preventivas.
Projetar e manter pipelines GitOps e estratégias de promoção entre ambientes.
Desenvolver e padronizar Helm Charts reutilizáveis.
Implementar estratégias avançadas de deploy como Canary Release e Blue/Green Deployment.
Evoluir pipelines e automações utilizando GitHub Actions em escala corporativa.
Provisionar e padronizar infraestrutura utilizando Terraform e Infraestrutura como Código (IaC).
Promover cultura de colaboração, ownership e melhoria contínua entre os times.
Requisitos para este desafio
Conhecimento avançado em Azure, incluindo APIM, Azure Container Apps, Networking, Storage e Databases.
Experiência com Kubernetes e ecossistema cloud-native.
Experiência prática com GitOps, Helm Charts e estratégias modernas de deploy.
Experiência com Terraform, incluindo modularização, versionamento e reutilização de módulos.
Domínio de GitHub Actions, automação via APIs e pipelines CI/CD.
Experiência com observabilidade, monitoramento e troubleshooting utilizando logs, métricas e tracing.
Vivência com práticas de SRE como SLI, SLA, SLO, Error Budgets e incident response.
Forte background em desenvolvimento utilizando Python ou linguagens similares.
Experiência com automação de infraestrutura e plataformas self-service.
Capacidade de atuar de forma consultiva e influenciar decisões técnicas entre múltiplos times.
Diferenciais
Experiência com Azure DevOps e plataformas internas de engenharia.
Conhecimento em Service Mesh e estratégias avançadas de tráfego.
Experiência com Platform Engineering e Internal Developer Platforms (IDP).
Vivência com segurança em cloud e governança de ambientes.
Experiência em ambientes de alta escala e alta criticidade.