Data Acquisition Engineer | Vaga afirmativa para PCD

AI overview

Join a talented team focused on acquiring legal data from diverse external sources, ensuring high quality and reliability in a challenging and dynamic environment.

Sobre o Jusbrasil

Transformar o sistema de Justiça com tecnologia não é um desafio trivial. Por isso, o Jusbrasil se posiciona como uma empresa AI-first, que utiliza IA Generativa, dados massivos e engenharia de ponta para resolver problemas complexos e criar impacto real em escala.

Estamos vivendo um ponto de virada: a revolução da GenAI está redefinindo o mercado, e temos nas mãos uma oportunidade rara de liderar a transformação tecnológica do sistema jurídico no Brasil

Lidamos com petabytes de dados, bilhões de documentos e desafios de escala, precisão e relevância dignos das maiores techs do mundo.

Nosso time opera com alta densidade de talentos, autonomia e propósito. São centenas de pessoas incríveis espalhadas por mais de 40 cidades no Brasil e fora, unidas pela mesma missão: construir soluções que melhorem o acesso à Justiça e ampliem a confiança nas relações sociais.

Aqui, valorizamos quem busca domínio profundo, age com clareza de propósito e tem energia para enfrentar grandes desafios com consistência e excelência.

Estamos construindo algo grande e queremos pessoas que queiram fazer parte dessa história, com intensidade, foco e excelência.


Jusbrasil em números:

+ de 1,2 bi de documentos jurídicos de interesse público

+ de 1PB de dados na nossa infraestrutura de tecnologia

+ de 30 m de usuários

+ de 500 colaboradores

+ de 80% dos advogados brasileiros cadastrados

 
 

Sobre a função

Buscamos uma pessoa Data Acquisition Engineer Pleno para integrar o time responsável pela aquisição e manutenção de dados jurídicos provenientes de fontes externas, como tribunais e sistemas públicos.

Essa posição é estratégica para garantir que os dados cheguem aos produtos do Jusbrasil com qualidade, estabilidade e confiabilidade, mesmo em um contexto de alta variabilidade das fontes (mudanças de HTML, bloqueios, indisponibilidade e inconsistências de dados).

O papel combina engenharia de software aplicada à extração de dados com atuação operacional no dia a dia, exigindo senso de responsabilidade, autonomia e capacidade de resposta rápida a incidentes. Ao mesmo tempo, oferece espaço para contribuir com melhorias estruturais que reduzam falhas recorrentes e aumentem a maturidade técnica do time.

Contexto do time e do negócio

O time de Data Acquisition é responsável por coletar, manter e garantir a qualidade de dados jurídicos provenientes de fontes externas como tribunais e sistemas públicos.

Esses dados são fundamentais para o funcionamento de diferentes produtos e serviços da empresa, impactando diretamente a experiência de usuários finais. Por depender de sistemas externos, o time atua em um ambiente de alta variabilidade técnica, lidando com mudanças frequentes de HTML, indisponibilidade de fontes, mecanismos de bloqueio e inconsistências nos dados de origem.

Além da construção dos robôs de coleta, o time tem papel relevante na estabilidade operacional, monitorando a ingestão, respondendo rapidamente a incidentes e colaborando com o time de Suporte quando há impacto para clientes. A qualidade do trabalho desse time influencia diretamente o volume de chamados, a confiabilidade das informações entregues e a eficiência operacional da organização.

Principais responsabilidades

  • Desenvolver e manter robôs de extração de dados (web scraping) em Python.
  • Implementar validações e tratamentos para garantir a qualidade e consistência dos dados.
  • Atuar em regime de on-call rotativo.
  • Apoiar o time de Suporte (especialmente B2B) na resolução de incidentes mais complexos.
  • Trabalhar sobre uma base de código existente, lidando com diferentes famílias de sistemas e exceções.

O que buscamos

  • Experiência prática com Python.
  • Conhecimento sólido de protocolo HTTP e fundamentos web.
  • Capacidade de extrair dados a partir de HTML.
  • Autonomia para investigar problemas e propor soluções.
  • Comunicação clara e colaborativa.
  • Senso de responsabilidade e confiabilidade.

Diferenciais 

  • Experiência prévia com web scraping (qualquer biblioteca ou abordagem).
  • Conhecimento em sistemas assíncronos.
  • Noções de proxy, captcha ou bypass de bloqueios.
  • Background em suporte técnico N2 ou N3 aliado à programação.
Ace your job interview

Understand the required skills and qualifications, anticipate the questions you may be asked, and study well-prepared answers using our sample responses.

Engineer Q&A's
Report this job
Apply for this job