Job Description
TOTVS |São Paulo - SP | Remoto
Descrição da vaga
Arquitetar, evoluir e operar a infraestrutura da plataforma de IA da Cloud TOTVS de forma segura, escalável e sustentável, garantindo previsibilidade operacional, baixo acoplamento tecnológico e eficiência financeira, suportando os serviços de inferência e suas dependências ao longo do crescimento dos produtos de IA da companhia.
Responsabilidades e atribuições
- Arquitetar e operar infraestrutura de inferência e suporte a treinamento e fine-tuning de modelos (GPU-first), em ambientes on-premises, cloud e serviços externos.
- Definir arquitetura física e lógica (rede, isolamento, alta disponibilidade, capacidade e resiliência).
- Planejar e executar a implantação da plataforma de IA, garantindo compatibilidade entre hardware, SO, drivers, CUDA, Kubernetes e stacks de inferência.
- Operar a plataforma de inferência em produção, assegurando disponibilidade, desempenho ...