Vaga 100% remota

Aqui a gente conecta o mundo

A Sensedia é líder no mercado de APIs, oferecendo soluções de integração e consultoria a grandes empresas no Brasil e no mundo, em uma variedade de setores. Seu portfólio, além de uma plataforma API Management, inclui Sensedia Integrations, Service Mesh, API Adaptive Governance, Events Hub, Open Banking & Finance e equipes estratégicas de Professional Services.

Trabalhar aqui é pertencer a uma cultura plural, descontraída e inovadora. É para quem tem coragem de ir além, pensar e agir fora da caixa. Preferimos pedir desculpas ao invés de pedir permissão e estamos sempre dispostos a nos transformar, nos reinventar.
Nossas pessoas são incríveis e você pode fazer parte disso tudo. Nos comprometemos em garantir um ambiente de trabalho acolhedor e respeitoso.

Conheça + em nosso site: https://br.sensedia.com/sensedia-careers

Qual a missão do Cargo?

Garantir a confiabilidade, disponibilidade, segurança e eficiência operacional das plataformas e produtos da Sensedia em ambientes de nuvem, atuando de forma estratégica e hands-on para prevenir incidentes, reduzir riscos sistêmicos e sustentar o crescimento da plataforma em larga escala. O principal desafio da posição é equilibrar velocidade de evolução do produto com estabilidade operacional, influenciando decisões técnicas junto aos times de engenharia, definindo padrões de observabilidade, automação e resiliência, além de atuar diretamente na gestão e resolução de incidentes críticos. Espera-se que o SRE Sênior tenha ownership de ponta a ponta, liderando melhorias estruturais em arquitetura operacional, pipelines, monitoramento e custos, promovendo uma cultura de confiabilidade, aprendizado contínuo e excelência operacional.

Quais serão suas atividades do dia-a-dia?

Atuar na garantia de confiabilidade, disponibilidade e performance dos ambientes de produção e não produção em nuvem.
Definir, evoluir e sustentar práticas de SRE, como observabilidade, automação, gestão de incidentes e prevenção de falhas.
Criar, manter e evoluir monitoramentos, alertas e dashboards (SLIs, SLOs, error budgets), antecipando problemas antes que impactem clientes.
Atuar de forma hands-on na análise e resolução de incidentes críticos, conduzindo post-mortems e promovendo melhorias estruturais.
Desenvolver e manter infraestrutura como código (Terraform, Helm) e automações para provisionamento, operação e recuperação de ambientes.
Trabalhar em parceria com os times de engenharia e produto, influenciando decisões arquiteturais com foco em resiliência, escalabilidade, segurança e custo.
Apoiar e evoluir pipelines de CI/CD, garantindo confiabilidade nas entregas e segurança nas implantações.
Monitorar e otimizar custos de infraestrutura, propondo melhorias de eficiência e uso consciente de recursos.
Atuar como referência técnica, disseminando boas práticas, padrões e cultura de confiabilidade dentro da empresa.

Quais são os requisitos obrigatórios para esse cargo?

Experiência sólida como SRE, DevOps ou Engenharia de Plataforma, atuando em ambientes de missão crítica e alta disponibilidade.
Conhecimento avançado em Cloud pública (AWS e/ou GCP), incluindo arquitetura, operação e troubleshooting de ambientes complexos.
Experiência prática com containers e orquestração (Docker e Kubernetes), incluindo operação em produção.
Forte domínio de observabilidade e monitoramento, utilizando ferramentas como Prometheus, Grafana, Victoria Metrics e similares.
Experiência em Linux, com capacidade de análise de incidentes, troubleshooting e gestão de serviços.
Vivência com Infraestrutura como Código (Terraform, Helm ou equivalentes).
Capacidade de desenvolver e manter automações e scripts (Shell e/ou Python).
Experiência em gestão e resposta a incidentes, incluindo análise de causa raiz e condução de post-mortems.
Conhecimento em redes (conceitos de segmentação, conectividade, debug e VPN).
Forte senso de ownership, responsabilidade e autonomia para tomada de decisão técnica.
Capacidade de se comunicar tecnicamente com clientes finais, explicando arquiteturas, decisões técnicas e soluções de conectividade de forma clara e segura.

Quais serão os requisitos diferencias para este cargo?

Experiência com OCI Cloud.
Experiência com plataformas de APIs e ambientes de alto tráfego.
Conhecimento em práticas de SRE (SLIs, SLOs, error budgets).
Vivência com arquiteturas resilientes (alta disponibilidade, DR, multi-região).
Experiência com gestão de logs (ELK ou similares).
Conhecimento em CI/CD e automação de pipelines.
Noções de segurança e otimização de custos em Cloud (FinOps).
Inglês avançado para comunicação técnica.

Aqui você vai encontrar:

Vale Refeição/Vale Alimentação (Cartão Flash benefícios), Plano de Saúde, Plano Odontológico, Seguro de Vida, PPR, TotalPass, Auxílio Creche, Programa Well-Being (destinado para saúde física e mental), Universidade Corporativa (nossa #SensediaAcademy), com diversas trilhas de desenvolvimento; Parceiros culturais e educacionais, com descontos especiais; Somos uma empresa cidadã, proporcionando licença maternidade e licença paternidade estendida.

Temos #WorkWhereYouBelong como proposta de valor, que é um modelo flexível de trabalho que nos ajuda a aumentar o senso de pertencimento dos Sensediers.
Trabalhe onde você pertence, porque as barreiras físicas estão menores, e o sentimento é de que exista apenas uma Sensedia em qualquer lugar que você esteja trabalhando.

Esta oportunidade também é para PCD! ;)

Suas experiências são compatíveis? Se candidate e venha conhecer a maior referência de APIs no Brasil! Queremos você em nossa equipe!!

Pensando em promover times cada vez mais diversos e ambientes de trabalho plurais, nossa missão é mapear os diferentes públicos que alcançamos com ele! Por isso, faremos algumas perguntinhas relacionadas à diversidade*, tudo bem? =)

Site Reliability Engineer | Sênior (12009)

AI overview