Na Workana, estamos em busca de um(a) Senior Site Reliability Engineer (SRE) para integrar o time de um dos nossos clientes e desempenhar um papel essencial na manutenção, automação e melhoria da confiabilidade dos sistemas que impulsionam sua rede logística em múltiplas regiões.
Sobre o cliente:
Trata-se de uma plataforma que gerencia fluxos logísticos altamente complexos, operando em múltiplas regiões e ambientes de alto volume. Atuando sob um modelo competitivo de ROWE – Results-Only Work Environment, no qual buscamos pessoas que desafiem o pensamento tradicional, proponham novas ideias e ajudem a redefinir como as operações modernas são construídas e escaladas.
Sobre o Projeto:
O(a) profissional será responsável por projetar sistemas resilientes, automatizar operações e colaborar com os times de engenharia, infraestrutura e banco de dados para garantir alta disponibilidade e total visibilidade do ambiente. Operam um ecossistema baseado em orquestração em tempo real, arquitetura orientada a eventos e processamento de dados em grande volume — por isso, buscamos alguém com domínio em arquiteturas complexas, capacidade de liderar iniciativas de otimização e visão para sustentar o crescimento escalável da operação. A plataforma é orientada a dados e processa milhões de transações diariamente. Os sistemas exigem acesso rápido, seguro e consistente às informações, ao mesmo tempo em que possibilitam inovação contínua e entregas seguras em larga escala.
Responsabilidades Principais:
- Definir, implementar e monitorar Service Level Objectives (SLOs), SLIs e error budgets em serviços principais.
- Construir e manter stacks de observabilidade usando NewRelic (ou outras ferramentas) para garantir visibilidade completa da saúde dos sistemas.
- Automatizar tarefas operacionais por meio de infraestrutura como código (IaC) e pipelines de CI/CD.
- Colaborar com os times de Infraestrutura e DBA para otimizar desempenho e melhorar a tolerância a falhas.
- Desenvolver processos de resposta a incidentes, runbooks e postmortems para aprimorar a confiabilidade dos sistemas.
- Gerenciar e ajustar sistemas baseados em Kafka, garantindo alta taxa de transferência e baixa latência.
- Participar de planejamento de capacidade, testes de carga e estratégias de escalabilidade para cenários de alta demanda.
- Melhorar continuamente os pipelines de deploy, monitoramento e procedimentos de recuperação.
- Fornecer mentoria técnica e orientar os times de engenharia nas melhores práticas de confiabilidade.
Requisitos Obrigatórios:
- Graduação em Ciência da Computação, Engenharia ou experiência equivalente.
- Experiência comprovada de 5 a 8 anos em funções de Site Reliability ou DevOps.
- Conhecimento sólido em AWS (EC2, ECS, S3, RDS, CloudWatch, Lambda, VPC).
- Forte domínio de ferramentas de observabilidade (NewRelic, Grafana, Prometheus, ElasticSearch, Kibana).
- Experiência na manutenção de sistemas orientados a eventos com Kafka.
- Familiaridade com Terraform, Docker e/ou Kubernetes para automação e deploy.
- Experiência na construção e manutenção de pipelines de CI/CD.
- Sólida compreensão de sistemas distribuídos, redes e otimização de desempenho.
- Disponibilidade para atuar presencialmente no escritório em São Paulo 3x por semana.
- Disponibilidade para participar de rodízio de plantão técnico (on-call rotation), cobrindo turnos noturnos e períodos de alta demanda.
- Flexibilidade para atuar em horas extras remuneradas, em caso de incidentes técnicos.
Requisitos Desejáveis:
- Experiência com frameworks de gerenciamento de incidentes.
- Conhecimento em práticas de confiabilidade de banco de dados e colaboração com times de DBA.
- Familiaridade com segurança, compliance e auditoria em ambientes em nuvem.
- Entendimento de otimização de custos e engenharia de performance na AWS.
- Fluência em inglês (falado e escrito).
Condições Contratuais e Benefícios:
- Modelo de trabalho: Híbrido (presencial em São Paulo 3x por semana).
- Jornada: Tempo integral (8 horas diárias).
- Remuneração: Entre R$ 15.000,00 e R$ 20.000,00 mensais, conforme senioridade.
- Contratação: PJ via cooperativa, diretamente com o cliente.
- Estabilidade: Possibilidade de parceria de longo prazo.
- Dia de folga remunerada no aniversário.
- 5 dias de Paid Time Off por ano, além do período de férias.
- Ambiente multicultural, com oportunidades de aprendizado junto a equipes de diversos países da região.
Processo de Seleção:
- Breve Vídeo Screening na plataforma Hireflix.
- Breve Call com Recruiter de Workana.
- Entrevista Técnica Cultural com cliente.
- Teste Técnico com cliente.
Se você está interessado(a) neste projeto e acha que é a pessoa certa, aguardamos sua inscrição. Se você for selecionado(a) para continuar, alguém da equipe Workana Talent entrará em contato com você!