Winnin
SRE Pleno
Job Description
Buscamos um(a) Platform Reliability Engineer para atuar como braço técnico de execução da Área de Plataforma, com foco em confiabilidade, observabilidade e FinOps.
Essa pessoa será responsável por implementar padrões corporativos que serão consumidos por todos os times de engenharia do Grupo Primo, garantindo autonomia, ownership e resultados mensuráveis em disponibilidade, performance e eficiência de custos.
É um papel hands-on, orientado a métricas e impacto organizacional.
Principais Responsabilidades
- Confiabilidade e Observabilidade
- Definir e implementar SLI/SLO para serviços críticos (latência, disponibilidade, taxa de erro).
- Estabelecer padrões corporativos de observabilidade (logs estruturados, traces distribuídos, métricas – RED/USE).
- Configurar dashboards e alertas no Datadog (SLO tracking, burn rate, detecção de anomalias).
- Criar e manter runbooks para troubleshooting e incident response.
- Part...