Nosso Modo de Fazer no Time:
Transforme sua carreira com o iFood! Somos uma empresa brasileira de tecnologia referência na América Latina. Por meio de soluções inovadoras, conectamos milhares de restaurantes a milhões de consumidores diariamente com uma média de 100 milhões de pedidos mensais. Além do delivery de comida, também somos Mercado, Farmácia e Pet. Temos também o iFood Pago, nossa Fintech, que engloba o iFood Benefícios, o vale alimentação e refeição do iFood e o próprio iFood Pago, o banco do restaurante. Junte-se a nós e faça parte de uma equipe que está sempre à frente com tecnologia de ponta e inovação constante.
Seu Cardápio Diário:
- Liderar o uso avançado de Distributed Tracing no Datadog, garantindo instrumentação precisa para visibilidade end-to-end em fluxos de negócios, o que é crucial para o diagnóstico rápido e a redução do MTTR.
- Desenvolver Alertas de Alta Fidelidade e dashboards customizados e de triagem no Datadog, garantindo que o time de resposta possa diagnosticar e restaurar o serviço o mais rápido possível em caso de falha.
-
Fornecer dados de Observabilidade e insights em tempo real para o time de resposta a incidentes durante eventos críticos, garantindo que a fase de diagnóstico seja acelerada.
- Atuar como o principal ponto técnico para Datadog (APM, Logs, Metrics, RUM), garantindo que a plataforma seja usada de forma eficiente e em todo o ecossistema.
- Otimizar a integração e uso do Sentry para garantir o tracking de erros de alta fidelidade, além de gerenciar a qualidade e o volume de logs.
- Colaborar com Product Managers e times de SRE para definir e monitorar Service Level Objectives (SLOs), utilizando o Datadog para garantir que as metas de confiabilidade do serviço sejam atingidas.
- Analisar dados de Observabilidade para otimizar os custos de ingestão (Datadog/Sentry) e propor ativamente melhorias de arquitetura usando AWS, Kubernetes e Terraform para máxima escalabilidade.
Ingredientes Que Buscamos:
- Experiência com DevOps, SRE e suporte à produção para sistemas baseados em nuvem.
- Proficiência em AWS, Kubernetes e Terraform para orquestração de contêineres e Infraestrutura como Código.
- Conhecimento profundo em sistemas Linux, redes e troubleshooting em ambientes distribuídos.
- Expertise avançada no uso e administração de Datadog e Sentry em ambientes de larga escala.
- Forte habilidade de scripting e programação em Python, Bash, Golang ou outras linguagens relevantes.
Para Realçar o Sabor:
- Experiência em projetar Service Level Objectives (SLOs) e trabalhar com Service Level Indicators (SLIs).
- Conhecimento prático com Prometheus e Grafana, ou Elasticsearch/OpenSearch, para monitoramento e análise de logs secundários.
- Experiência com ArgoCD ou outros GitOps workflows para automação de deploy de Observabilidade.
Buscamos uma pessoa apaixonada por tecnologia, que esteja sempre em busca de novos aprendizados e que goste de desafios. Se você se identifica com este perfil, adoraríamos conhecer você!