Na Workana, estamos em busca de um(a) Senior Site Reliability Engineer (SRE) para integrar o time de um dos nossos clientes e desempenhar um papel essencial na manutenção, automação e melhoria da confiabilidade dos sistemas que impulsionam sua rede logística em múltiplas regiões.

Sobre o cliente:

Trata-se de uma plataforma que gerencia fluxos logísticos altamente complexos, operando em múltiplas regiões e ambientes de alto volume. Atuando sob um modelo competitivo de ROWE – Results-Only Work Environment, no qual buscamos pessoas que desafiem o pensamento tradicional, proponham novas ideias e ajudem a redefinir como as operações modernas são construídas e escaladas.

Sobre o Projeto:

O(a) profissional será responsável por projetar sistemas resilientes, automatizar operações e colaborar com os times de engenharia, infraestrutura e banco de dados para garantir alta disponibilidade e total visibilidade do ambiente. Operam um ecossistema baseado em orquestração em tempo real, arquitetura orientada a eventos e processamento de dados em grande volume — por isso, buscamos alguém com domínio em arquiteturas complexas, capacidade de liderar iniciativas de otimização e visão para sustentar o crescimento escalável da operação. A plataforma é orientada a dados e processa milhões de transações diariamente. Os sistemas exigem acesso rápido, seguro e consistente às informações, ao mesmo tempo em que possibilitam inovação contínua e entregas seguras em larga escala.

Responsabilidades Principais:

Definir, implementar e monitorar Service Level Objectives (SLOs), SLIs e error budgets em serviços principais.
Construir e manter stacks de observabilidade usando NewRelic (ou outras ferramentas) para garantir visibilidade completa da saúde dos sistemas.
Automatizar tarefas operacionais por meio de infraestrutura como código (IaC) e pipelines de CI/CD.
Colaborar com os times de Infraestrutura e DBA para otimizar desempenho e melhorar a tolerância a falhas.
Desenvolver processos de resposta a incidentes, runbooks e postmortems para aprimorar a confiabilidade dos sistemas.
Gerenciar e ajustar sistemas baseados em Kafka, garantindo alta taxa de transferência e baixa latência.
Participar de planejamento de capacidade, testes de carga e estratégias de escalabilidade para cenários de alta demanda.
Melhorar continuamente os pipelines de deploy, monitoramento e procedimentos de recuperação.
Fornecer mentoria técnica e orientar os times de engenharia nas melhores práticas de confiabilidade.

Requisitos Obrigatórios:

Graduação em Ciência da Computação, Engenharia ou experiência equivalente.
Experiência comprovada de 5 a 8 anos em funções de Site Reliability ou DevOps.
Conhecimento sólido em AWS (EC2, ECS, S3, RDS, CloudWatch, Lambda, VPC).
Forte domínio de ferramentas de observabilidade (NewRelic, Grafana, Prometheus, ElasticSearch, Kibana).
Experiência na manutenção de sistemas orientados a eventos com Kafka.
Familiaridade com Terraform, Docker e/ou Kubernetes para automação e deploy.
Experiência na construção e manutenção de pipelines de CI/CD.
Sólida compreensão de sistemas distribuídos, redes e otimização de desempenho.
Disponibilidade para atuar presencialmente no escritório em São Paulo 3x por semana.
Disponibilidade para participar de rodízio de plantão técnico (on-call rotation), cobrindo turnos noturnos e períodos de alta demanda.
Flexibilidade para atuar em horas extras remuneradas, em caso de incidentes técnicos.

Requisitos Desejáveis:

Experiência com frameworks de gerenciamento de incidentes.
Conhecimento em práticas de confiabilidade de banco de dados e colaboração com times de DBA.
Familiaridade com segurança, compliance e auditoria em ambientes em nuvem.
Entendimento de otimização de custos e engenharia de performance na AWS.
Fluência em inglês (falado e escrito).

Condições Contratuais e Benefícios:

Modelo de trabalho: Híbrido (presencial em São Paulo 3x por semana).
Jornada: Tempo integral (8 horas diárias).
Remuneração: Entre R$ 15.000,00 e R$ 20.000,00 mensais, conforme senioridade.
Contratação: PJ via cooperativa, diretamente com o cliente.
Estabilidade: Possibilidade de parceria de longo prazo.
Dia de folga remunerada no aniversário.
5 dias de Paid Time Off por ano, além do período de férias.
Ambiente multicultural, com oportunidades de aprendizado junto a equipes de diversos países da região.

Processo de Seleção:

Breve Vídeo Screening na plataforma Hireflix.
Breve Call com Recruiter de Workana.
Entrevista Técnica Cultural com cliente.
Teste Técnico com cliente.

Se você está interessado(a) neste projeto e acha que é a pessoa certa, aguardamos sua inscrição. Se você for selecionado(a) para continuar, alguém da equipe Workana Talent entrará em contato com você!

Sr Site Reliability Engineer (SRE) - Brazil

AI overview

Perks & Benefits Extracted with AI