(Seoul) Senior Data Engineer

AI overview

Develop and manage healthcare data pipelines and governance frameworks for AI solutions impacting cancer diagnosis and treatment at scale.

This position is open for candidates who reside in Korea and have a Korean proficiency appropriate for working in a Korean business.

"Conquering cancer through AI"

Lunit은 "Learning Unit"을 줄여 만든 이름으로, 암 진단 및 치료에 기여하는 인공지능 솔루션을 개발하고 제공하는 의료 AI 기업입니다.
루닛은 인공지능 기술을 통해 더 정확한 암 진단과 치료 효과 예측이 가능해지고, 환자를 위한 신속한 맞춤형 치료가 가능해지는 시대를 열고자 합니다.

💭 About the team

  • What do we do? (Department Mission)
    AI Platform Department 는 전 세계 환자의 진단과 치료에 실제로 사용되는 의료 AI 모델이 안정적으로 동작하도록 데이터·학습·운영·서빙 전반을 아우르는 기반 플랫폼을 구축합니다. 우리는 기술을 통해 암의 조기 발견과 정확한 치료라는 목표에 기여하고자 합니다.
  • How do we work? (Work Style)
    • 빠르게 시도하고 실사용자 피드백을 바탕으로 지속적으로 개선하는 개발 문화
    • 문제 정의 단계부터 PM, AI 연구자, 엔지니어가 함께 참여하는 강한 협업 구조
    • 품질을 지키면서 속도를 높이기 위해 AI 기반 개발·자동화 도구 적극 활용
    • 명확한 설계와 코드 리뷰를 통한 투명한 기술 의사결정
  • What kind of problems do we solve? (Design Philosophy)
    • TB~PB 규모의 의료 데이터를 다루는 대규모 데이터 인프라 문제
    • 데이터 보안·프라이버시 규제를 충족하는 엔터프라이즈 아키텍처
    • 연구자가 수천 건의 실험을 수행할 수 있도록 지원하는 대규모 ML 파이프라인 자동화
    • 글로벌 병원 인프라와 연결된 데이터 연동·모니터링 시스템
  • Who will I spend 8+ hours/day with? (Co-workers)
    • 글로벌 인재로 구성된 AI 연구자, SW 엔지니어, MLOps 엔지니어 등 전문성 높은 동료들
    • 영어와 한국어가 자연스럽게 공존하는 팀 환경
    • 서로의 지식과 배경을 존중하며 함께 성장하는 문화

💭 About the position

  • What will I build? (Scope of Work)
    • 의료 데이터 수집·정제·변환 파이프라인
    • AI 학습 데이터셋 생성 및 버전 관리 시스템
    • 대규모 ML 워크플로우 자동화
    • Data Lineage, Metadata, Quality 관리 체계
    • 규제·보안이 중요한 의료 데이터 거버넌스 인프라
    • 글로벌 SaaS 형태의 의료 AI 데이터 플랫폼
  • What design/engineering challenges will I face? (Focus Area)
    • PB 규모 의료 데이터 파이프라인 설계
    • 멀티클라우드(AWS/GCP/Azure) 운영
    • 의료 규제 준수 + 자동화를 동시에 만족하는 구조 설계
    • GPU 학습 환경과 연동되는 고성능 데이터 공급 문제 해결
    • 글로벌 연구자와 함께 사용하는 공용 ML 플랫폼 구축
    • 제품–연구–엔지니어링 요구를 조율하는 협업 중심의 문제 해결
  • What kind of engineer fits well here? (Ideal Profile)
    • 데이터 시스템의 “전체 흐름”과 “구조”를 설계하는 일을 좋아하는 분
    • 복잡한 문제를 구조화하고 실용적인 해결책을 제시할 수 있는 분
    • Data Quality, Security, Lineage 에 높은 기준을 가진 분
    • '의료 AI'라는 어려운 도메인에서 의미 있는 변화를 만들고 싶은 분
  • How will I grow? (Opportunities)
    • 복잡한 AI·데이터 시스템을 총괄적으로 설계하는 경험
    • 글로벌 의료 AI SaaS 플랫폼 구축 경험
    • Research–MLOps–Engineering이 맞물린 대규모 조직 구조에서의 성장
    • 플랫폼 아키텍처 전반에 영향을 미치는 핵심 기술 결정 기회

🚩 주요 업무

우리가 구축하는 데이터 인프라와 파이프라인은 의료 AI 모델의 정확도·재현성·신뢰성을 결정하는 핵심 요소입니다. Data Engineer의 한 줄 코드, 하나의 파이프라인 개선은 결국 전 세계 환자의 진단 결과에 직접적인 영향을 미칩니다.

  • TB~PB 규모의 의료 영상·진단 데이터를 안정적으로 처리하기 위한 데이터 파이프라인을 설계·자동화·운영
  • 통합된 데이터 포맷에 대한 Governance 를 수립하고 지속적으로 관리하여 데이터 표준화와 품질을 보장
  • 데이터 수집–정제–변환–검증–배포까지 이어지는 End-to-End DataOps 워크플로우를 구축하여, AI 연구자와 MLOps 엔지니어의 생산성을 극대화
  • 의료 규제(HIPAA, GDPR, EU AI Act 등)를 충족하는 보안·접근제어·감사 체계(RBAC, Audit Trail)를 설계
  • GPU 대규모 학습 환경과 연동되는 학습 데이터 관리 파이프라인(Data Versioning, Lineage, Quality Check)을 구성
  • Airflow·Prefect 등 Workflow Orchestrator 기반의 스케줄링·모니터링·장애 대응 자동화를 구축
  • AI 기반 개발도구(Cursor, Codex, ChatGPT, Claude Code 등)을 적극 활용해 파이프라인 생성·테스트·문서화를 자동화하며 팀 전체의 생산성을 향상
  • 플랫폼을 사용하는 연구자·엔지니어와 긴밀하게 협업하여, 실제 문제를 해결하는 운영 친화적 데이터 인프라를 구축

🚩 Tech Stack

AI Platform Department는 AI를 활용해 품질을 유지하면서 생산성을 극대화하는 엔지니어링 문화를 지향합니다.

  • Core Technologies
    • Python 기반 데이터·워크플로우 개발
    • Prefect, Airflow 기반 ETL/ML 파이프라인
    • PostgreSQL, BigQuery, Athena
    • S3/GCS 기반 대용량 데이터 처리
    • Kubernetes, Docker
    • MLflow, DVC, LakeFS
    • Kafka, Redis (필요 시)
  • Security / Governance
    • 의료 데이터 및 모델에 대한 Governance/Lineage
    • RBAC 기반 안전한 데이터 접근
    • 데이터 품질 검증 및 정책 기반 접근 관리

Requirements

🎯 자격요건

  • 데이터 플랫폼·파이프라인 설계/운영
    • 데이터 플랫폼/파이프라인 설계·운영 7년 이상의 실무 경험
    • DataOps/MLOps 환경 구축 경험
    • Airflow, Prefect 기반 ETL/ML 파이프라인 설계·운영 경험
    • 분산 환경(S3/GCS/HDFS 등)에서의 대용량 파일·메타데이터 처리 경험
    • 데이터 버전 관리(DVC, LakeFS) 및 메타데이터 추적 구현 경험
  • 데이터 품질·보안·거버넌스
    • 데이터 품질, 안정성, 보안, 거버넌스를 고려한 설계 경험
    • RBAC, IAM, 정책 기반 접근제어 시스템 설계 경험
    • 데이터 품질 지표 및 자동화된 테스트·검증 구축 경험
  • AI·의료 도메인 이해
    • 의료 데이터(DICOM, Pathology, PHI 등) 이해 또는 학습 의지
    • AI 모델 개발·임상 워크플로우 등 도메인 지식
  • 플랫폼 아키텍처 및 운영 경험
    • SaaS 기반 데이터 플랫폼 구축 경험
    • 실시간/스트리밍 데이터 처리(Kafka, Flink 등) 경험
    • 클라우드 비용 최적화 및 데이터 카탈로그 구축 경험
  • 협업 및 커뮤니케이션
    • AI Research, MLOps, Backend, 의료 전문가 등과의 협업 능력
    • 요구사항 조율 및 기술적 커뮤니케이션 역량
    • 영어 커뮤니케이션 역량
  • 문제 정의 및 설계 역량
    • 문제를 구조화하고 실행 가능한 설계·로드맵으로 구체화하는 분석력
    • 사용자 중심의 플랫폼 구조 설계 경험
  • 조직 기여 및 기술 성장
    • 주니어 엔지니어 멘토링 경험

🏅 우대사항

  • 의료 데이터 특성(DICOM, Pathology image, PHI 관리 등) 이해
  • 대규모 GPU 학습 환경 및 데이터 공급 파이프라인 구축 경험
  • 데이터 품질 지표(DQ), 자동화된 테스트·검증 시스템 구축 경험
  • 클라우드 비용 최적화 경험
  • 데이터 카탈로그(DataHub, Amundsen 등) 구축 경험
  • 주니어 엔지니어 멘토링 경험
  • 글로벌 협업 경험

📝 제출서류

  • 자유양식의 CV
  • 포트폴리오 또는 기타 관련 자료(선택사항)

🏃‍♀️ 전형 절차

  • Document Screening → Competency-based Interview → Culture-fit Interview → Onboarding
    • 최종 면접 이후, 필요 시 레퍼런스 체크를 진행할 수 있습니다.

🤝 근무 조건 및 근무 환경

  • 근무형태 : 정규직
  • 근무지역 : 루닛본사 (강남구 강남대로 374 케이스퀘어 강남2, 5층)
  • 급여 : 면접 후 결정

🎸 기타사항

  • 입사지원 서류에 허위사실이 발견될 경우, 채용확정 이후라도 채용이 취소될 수 있습니다.
  • 국가 유공자 및 장애인 등 취업보호대상자는 관계법령에 따라 우대합니다.
  • 본 공고는 수시 채용으로, 조기 마감될 수 있습니다.

Benefits

🌻 Benefits & Perks

  • 강남역 3번 출구 도보 1분 거리에 위치한 신규 오피스(언덕 없는 평지)
  • 오피스 근무 시 12,000원의 식비 지원(점심,저녁) 및 무제한 간식 제공
  • 데스크테리어 비용 30만원 지원
  • 최신 사양의 컴퓨터 장비(Mac, 4K 모니터 등)선택, 3년마다 최신형 장비 지원 
  • 학회 참석, 직무 교육, 도서 구매 지원
  • 정규 사내 인공지능/의료 세미나 개최
  • 원어민 영어 교육 프로그램 수강 지원
  • 대규모 고품질 인공지능 학습 데이터 및 딥러닝 DevOps 시스템 보유
  • 자유롭게 쓸 수 있는 복지 포인트 연간 120만원 지원
  • 명절 선물 및 각종 경조사에 대한 경조사비와 경조휴가 지원
  • 종합건강검진, 임직원 상해 보험 가입 등의 지원
  • 월별 1회 소모임 활동 시 비용 지원

Perks & Benefits Extracted with AI

  • Education Stipend: 학회 참석, 직무 교육, 도서 구매 지원
  • 12,000 KRW meal support and unlimited snacks: 오피스 근무 시 12,000원의 식비 지원(점심,저녁) 및 무제한 간식 제공
  • Comprehensive health check-ups and employee accident insurance: 종합건강검진, 임직원 상해 보험 가입 등의 지원
  • 300,000 KRW desk setup cost support: 데스크테리어 비용 30만원 지원
  • Monthly social activity cost support: 월별 1회 소모임 활동 시 비용 지원
  • 1,200,000 KRW annual welfare points: 자유롭게 쓸 수 있는 복지 포인트 연간 120만원 지원

"Perfecting Intelligence, Transforming Medicine"Lunit, a portmanteau of ‘Learning unit,’ is a medical AI software company devoted to providing AI-powered total cancer care.Our AI solutions help discover cancer and predict cancer treatment outcomes, achieving timely and individually-tailored cancer treatment.We want our AI technology to not only perform in the highest level, but also to serve for ‘the right’ purposes. For us, this is ‘saving more lives.’ We aim to solve the most critical issues in cancer care today: reduce medical cost and prolong survival. As a company, our philosophy is to follow value over profit. Our eyes are fixed in the fundamental and inherent values, while we simply take a portion of the fruit we bear.

View all jobs
Ace your job interview

Understand the required skills and qualifications, anticipate the questions you may be asked, and study well-prepared answers using our sample responses.

Senior Data Engineer Q&A's
Report this job
Apply for this job