Somos especialistas em transformação tecnológica, unindo expertise humana à IA para criar soluções tech escaláveis. Com mais de 8,000 CI&Ters ao redor do mundo, já formamos parcerias com mais de 1,000 clientes durante nossos 30 anos de história. Inteligência Artificial é nossa realidade.
Importante: se você reside na Região Metropolitana de Campinas, sua presença nos escritórios da cidade será obrigatória, conforme a política de frequencia vigente.
Responsabilidades:
- Projetar, desenvolver e manter pipelines de dados (batch e streaming) para ingestão, transformação e disponibilização de dados para analytics e consumo por aplicações.
- Construir e evoluir modelagem analítica (camadas bronze/silver/gold, data marts, star schema, wide tables), garantindo consistência, documentação e reuso.
- Implementar boas práticas de qualidade de dados (testes, validações, contratos, SLAs/SLOs, monitoramento de freshness/completeness/accuracy) e atuar na resolução de incidentes com RCA.
- Definir e manter governança técnica de dados: catálogo, linhagem, versionamento, nomenclatura, ownership, políticas de acesso e trilha de auditoria.
- Otimizar performance e custo em consultas e pipelines (particionamento, clustering, incremental loads, materializações, tuning de jobs).
- Apoiar o ciclo completo de entrega (discovery → desenvolvimento → validação → operação), alinhando requisitos de negócio com necessidades técnicas e garantindo previsibilidade.
- Colaborar com times de BI/Analytics na definição de métricas, dimensões, fatos e camada semântica, assegurando rastreabilidade de indicadores.
- Viabilizar e operacionalizar casos de uso com IA/ML.
- Integrar fontes e sistemas (APIs, bancos, filas, eventos, arquivos), garantindo segurança, idempotência, tolerância a falhas e rastreabilidade ponta a ponta.
- Produzir e manter documentação técnica e funcional relevante para auditoria, suporte e transferência de conhecimento.
Requisitos:
- Experiência comprovada como Data Engineer com foco em Analytics (construção de pipelines, modelagem e disponibilização para consumo).
- Domínio de SQL e boa base em Python (ou linguagem equivalente) para engenharia de dados e automação.
- Experiência com orquestração e desenho de workflows (ex.: Airflow, Dagster, Prefect ou similar).
- Experiência com data warehouses/lakehouses e formatos/arquiteturas analíticas (ex.: BigQuery/Snowflake/Databricks/Spark; Parquet/Delta/Iceberg).
- Vivência com ETL/ELT, cargas incrementais (CDC quando aplicável), particionamento e otimização de performance/custo.
- Conhecimento de boas práticas de qualidade e confiabilidade (testes de dados, observabilidade, métricas, gestão de incidentes e RCA).
- Experiência com versionamento (Git) e práticas de entrega (code review, padrões de branch, CI básico).
- Boa comunicação verbal e escrita para interação com áreas técnicas e stakeholders, com capacidade de traduzir necessidades em entregáveis claros.
Diferencial:
- Experiência em cloud (preferencialmente GCP, mas vale AWS/Azure), incluindo IAM, redes básicas e custos.
- Experiência com dbt (modelagem, testes, documentação) e boas práticas de camada semântica/metrics layer.
- Experiência com streaming (Kafka/PubSub/Kinesis), processamento incremental e arquiteturas orientadas a eventos.
- Familiaridade com Data Governance e ferramentas de catálogo/linhagem (ex.: Data Catalog, Collibra, Amundsen, OpenLineage/Marquez).
- Experiência com MLOps/LLMOps (monitoramento, avaliação, drift, versionamento de dados/modelos, pipelines de treinamento e deploy).
- Experiência com RAG e embeddings, construção de pipelines de indexação, e práticas de segurança para GenAI (PII redaction, prompt injection awareness, controles de acesso).
- Experiência com testes de performance de consultas e pipelines, e estratégias de otimização de custos.
- Vivência em ambientes ágeis (Scrum/Kanban) e colaboração próxima com Product Owner/PM para priorização baseada em valor e risco.
- Uso de ferramentas de apoio (incluindo IA) para acelerar documentação, sumarização de pipelines/SQL, geração de casos de teste e apoio à análise — com validação técnica humana.
#LI-RR2
Midsenior