Job Description
Job Description
Sobre a posição
Buscamos um(a) Site Reliability Engineer (SRE) para atuar na construção, manutenção e evolução da nossa plataforma, garantindo alta disponibilidade, performance e escalabilidade dos nossos serviços. A pessoa ideal possui forte experiência com ambientes Kubernetes, AWS e práticas modernas de observabilidade.
Responsabilidades
Projetar, implementar e evoluir arquiteturas de infraestrutura resilientes, escaláveis e seguras.Administrar e otimizar clusters Kubernetes em ambientes produtivos.Operar e aprimorar ambientes em AWS, garantindo boas práticas de custo, segurança e performance.Criar e manter pipelines de CI/CD, automatizando fluxos em Git/Jenkins.Implementar e melhorar soluções de observabilidade com Datadog (métricas, logs, traces, alertas).Desenvolver e manter infraestrutura como código (IaC) utilizando ferramentas como Te...