PagBank
Engenheiro de Sistemas Pl.
Job Description
Responsabilidades e atribuições
- Desenhar e manter observabilidade fim a fim (logs, métricas, traces) usando, Grafana e Prometheus, com painéis e alertas.
- Administrar e evoluir alertas (thresholds, regras, correlação) e implementar runbooks para respostas padronizadas.
- Responder a incidentes (triagem, diagnóstico, mitigação, comunicação) e conduzir postmortems com ações estruturais para reduzir MTTR e recorrência.
- Troubleshooting avançado em produção (análise de logs, profiling, traces distribuídos, p99, saturação/latência/erros) e tuning de SO Unix e JVM.
- Capacity & performance management (dimensionamento, previsão de demanda, testes de performance), com foco em custo/benefício.
- Administrar e otimizar serviços AWS: EC2, VPC, S3, CloudWatch, ACM, IAM.
- Orquestração com Kubernetes/EKS/ECS: policies, quotas, requests/limits, autoscaling (HPA/VPA), ASG, e observabilidade de workloads.
- Edge e entrega: CloudFro...