Engenheiro de Software Senior (SRE/DevOps)

AI overview

Drive observability and incident response efficiency by optimizing Datadog and Sentry integrations while collaborating on Service Level Objectives for service reliability.

Nosso Modo de Fazer no Time:

Transforme sua carreira com o iFood! Somos uma empresa brasileira de tecnologia referência na América Latina. Por meio de soluções inovadoras, conectamos milhares de restaurantes a milhões de consumidores diariamente com uma média de 100 milhões de pedidos mensais. Além do delivery de comida, também somos Mercado, Farmácia e Pet. Temos também o iFood Pago, nossa Fintech, que engloba o iFood Benefícios, o vale alimentação e refeição do iFood e o próprio iFood Pago, o banco do restaurante. Junte-se a nós e faça parte de uma equipe que está sempre à frente com tecnologia de ponta e inovação constante.

 

Seu Cardápio Diário:

  • Liderar o uso avançado de Distributed Tracing no Datadog, garantindo instrumentação precisa para visibilidade end-to-end em fluxos de negócios, o que é crucial para o diagnóstico rápido e a redução do MTTR.
  • Desenvolver Alertas de Alta Fidelidade e dashboards customizados e de triagem no Datadog, garantindo que o time de resposta possa diagnosticar e restaurar o serviço o mais rápido possível em caso de falha.
  • Fornecer dados de Observabilidade e insights em tempo real para o time de resposta a incidentes durante eventos críticos, garantindo que a fase de diagnóstico seja acelerada.
  • Atuar como o principal ponto técnico para Datadog (APM, Logs, Metrics, RUM), garantindo que a plataforma seja usada de forma eficiente e em todo o ecossistema.
  • Otimizar a integração e uso do Sentry para garantir o tracking de erros de alta fidelidade, além de gerenciar a qualidade e o volume de logs.
  • Colaborar com Product Managers e times de SRE para definir e monitorar Service Level Objectives (SLOs), utilizando o Datadog para garantir que as metas de confiabilidade do serviço sejam atingidas.
  • Analisar dados de Observabilidade para otimizar os custos de ingestão (Datadog/Sentry) e propor ativamente melhorias de arquitetura usando AWS, Kubernetes e Terraform para máxima escalabilidade.

 

Ingredientes Que Buscamos:

  • Experiência com DevOps, SRE e suporte à produção para sistemas baseados em nuvem.
  • Proficiência em AWS, Kubernetes e Terraform para orquestração de contêineres e Infraestrutura como Código.
  • Conhecimento profundo em sistemas Linux, redes e troubleshooting em ambientes distribuídos.
  • Expertise avançada no uso e administração de Datadog e Sentry em ambientes de larga escala.
  • Forte habilidade de scripting e programação em Python, Bash, Golang ou outras linguagens relevantes.

 

Para Realçar o Sabor:

  • Experiência em projetar Service Level Objectives (SLOs) e trabalhar com Service Level Indicators (SLIs).
  • Conhecimento prático com Prometheus e Grafana, ou Elasticsearch/OpenSearch, para monitoramento e análise de logs secundários.
  • Experiência com ArgoCD ou outros GitOps workflows para automação de deploy de Observabilidade.

 

Buscamos uma pessoa apaixonada por tecnologia, que esteja sempre em busca de novos aprendizados e que goste de desafios. Se você se identifica com este perfil, adoraríamos conhecer você!

Get hired quicker

Be the first to apply. Receive an email whenever similar jobs are posted.

Ace your job interview

Understand the required skills and qualifications, anticipate the questions you may be asked, and study well-prepared answers using our sample responses.

DevOps Q&A's
Report this job
Apply for this job