Site Reliability Engineer | Sênior (12009)

Conceicao , Brazil
full-time Remote

AI overview

Guarantee the reliability and operational efficiency of Sensedia's platforms in cloud environments while leading critical incident management and promoting a culture of reliability.

Vaga 100% remota

Aqui a gente conecta o mundo 

A Sensedia é líder no mercado de APIs, oferecendo soluções de integração e consultoria a grandes empresas no Brasil e no mundo, em uma variedade de setores. Seu portfólio, além de uma plataforma API Management, inclui Sensedia Integrations, Service Mesh, API Adaptive Governance, Events Hub, Open Banking & Finance e equipes estratégicas de Professional Services.

Trabalhar aqui é pertencer a uma cultura plural, descontraída e inovadora. É para quem tem coragem de ir além, pensar e agir fora da caixa. Preferimos pedir desculpas ao invés de pedir permissão e estamos sempre dispostos a nos transformar, nos reinventar.
Nossas pessoas são incríveis e você pode fazer parte disso tudo. Nos comprometemos em garantir um ambiente de trabalho acolhedor e respeitoso.

Conheça + em nosso site: https://br.sensedia.com/sensedia-careers


Qual a missão do Cargo?

Garantir a confiabilidade, disponibilidade, segurança e eficiência operacional das plataformas e produtos da Sensedia em ambientes de nuvem, atuando de forma estratégica e hands-on para prevenir incidentes, reduzir riscos sistêmicos e sustentar o crescimento da plataforma em larga escala. O principal desafio da posição é equilibrar velocidade de evolução do produto com estabilidade operacional, influenciando decisões técnicas junto aos times de engenharia, definindo padrões de observabilidade, automação e resiliência, além de atuar diretamente na gestão e resolução de incidentes críticos. Espera-se que o SRE Sênior tenha ownership de ponta a ponta, liderando melhorias estruturais em arquitetura operacional, pipelines, monitoramento e custos, promovendo uma cultura de confiabilidade, aprendizado contínuo e excelência operacional.

 

Quais serão suas atividades do dia-a-dia?

  • Atuar na garantia de confiabilidade, disponibilidade e performance dos ambientes de produção e não produção em nuvem.
  • Definir, evoluir e sustentar práticas de SRE, como observabilidade, automação, gestão de incidentes e prevenção de falhas.
  • Criar, manter e evoluir monitoramentos, alertas e dashboards (SLIs, SLOs, error budgets), antecipando problemas antes que impactem clientes.
  • Atuar de forma hands-on na análise e resolução de incidentes críticos, conduzindo post-mortems e promovendo melhorias estruturais.
  • Desenvolver e manter infraestrutura como código (Terraform, Helm) e automações para provisionamento, operação e recuperação de ambientes.
  • Trabalhar em parceria com os times de engenharia e produto, influenciando decisões arquiteturais com foco em resiliência, escalabilidade, segurança e custo.
  • Apoiar e evoluir pipelines de CI/CD, garantindo confiabilidade nas entregas e segurança nas implantações.
  • Monitorar e otimizar custos de infraestrutura, propondo melhorias de eficiência e uso consciente de recursos.
  • Atuar como referência técnica, disseminando boas práticas, padrões e cultura de confiabilidade dentro da empresa.

 

Quais são os requisitos obrigatórios para esse cargo? 

  • Experiência sólida como SRE, DevOps ou Engenharia de Plataforma, atuando em ambientes de missão crítica e alta disponibilidade.
  • Conhecimento avançado em Cloud pública (AWS e/ou GCP), incluindo arquitetura, operação e troubleshooting de ambientes complexos.
  • Experiência prática com containers e orquestração (Docker e Kubernetes), incluindo operação em produção.
  • Forte domínio de observabilidade e monitoramento, utilizando ferramentas como Prometheus, Grafana, Victoria Metrics e similares. 
  • Experiência em Linux, com capacidade de análise de incidentes, troubleshooting e gestão de serviços.
  • Vivência com Infraestrutura como Código (Terraform, Helm ou equivalentes).
  • Capacidade de desenvolver e manter automações e scripts (Shell e/ou Python).
  • Experiência em gestão e resposta a incidentes, incluindo análise de causa raiz e condução de post-mortems.
  • Conhecimento em redes (conceitos de segmentação, conectividade, debug e VPN).
  • Forte senso de ownership, responsabilidade e autonomia para tomada de decisão técnica.
  • Capacidade de se comunicar tecnicamente com clientes finais, explicando arquiteturas, decisões técnicas e soluções de conectividade de forma clara e segura.

 

Quais serão os requisitos diferencias para este cargo? 

  • Experiência com OCI Cloud.
  • Experiência com plataformas de APIs e ambientes de alto tráfego. 
  • Conhecimento em práticas de SRE (SLIs, SLOs, error budgets). 
  • Vivência com arquiteturas resilientes (alta disponibilidade, DR, multi-região).
  • Experiência com gestão de logs (ELK ou similares).
  • Conhecimento em CI/CD e automação de pipelines.
  • Noções de segurança e otimização de custos em Cloud (FinOps).
  • Inglês avançado para comunicação técnica.

 

Aqui você vai encontrar:

 

  • Vale Refeição/Vale Alimentação (Cartão Flash benefícios), Plano de Saúde, Plano Odontológico, Seguro de Vida, PPR, TotalPass, Auxílio Creche, Programa Well-Being (destinado para saúde física e mental), Universidade Corporativa (nossa #SensediaAcademy), com diversas trilhas de desenvolvimento; Parceiros culturais e educacionais, com descontos especiais; Somos uma empresa cidadã,  proporcionando licença maternidade e licença paternidade estendida.

  • Temos #WorkWhereYouBelong como proposta de valor, que é um modelo flexível de trabalho que nos ajuda a aumentar o senso de pertencimento dos Sensediers.
    Trabalhe onde você pertence, porque as barreiras físicas estão menores, e o sentimento é de que exista apenas uma Sensedia em qualquer lugar que você esteja trabalhando.

Esta oportunidade também é para PCD! ;)


Suas experiências são compatíveis? Se candidate e venha conhecer a maior referência de APIs no Brasil! Queremos você em nossa equipe!!

 

  • Pensando em promover times cada vez mais diversos e ambientes de trabalho plurais, nossa missão é  mapear os diferentes públicos que alcançamos com ele! Por isso, faremos algumas perguntinhas relacionadas à diversidade*, tudo bem? =)
 
 *Os dados pessoais e dados pessoais sensíveis coletados serão tratados de acordo com a Lei Geral de Proteção de Dados - Lei n° 13.709/2018

Perks & Benefits Extracted with AI

  • Health Insurance: Plano de Saúde, Plano Odontológico, Seguro de Vida
  • Vale Refeição, Alimentação e outros benefícios: Vale Refeição/Vale Alimentação (Cartão Flash benefícios), PPR, TotalPass, Auxílio Creche, Programa Well-Being (destinado para saúde física e mental), Universidade Corporativa (nossa #SensediaAcademy), com diversas trilhas de desenvolvimento; Parceiros culturais e educacionais, com descontos especiais.
  • Paid Parental Leave: licença maternidade e licença paternidade estendida

Modernize and integrate your architecture combining APIs, Microservices, Api Gateway, Service Mesh and Event Driven - Sensedia API Management

View all jobs
Ace your job interview

Understand the required skills and qualifications, anticipate the questions you may be asked, and study well-prepared answers using our sample responses.

Site Reliability Engineer Q&A's
Report this job
Apply for this job