업스테이지는 AI 기술로 해결할 수 있는 비즈니스 문제들을 풀어갑니다. "Making AI Beneficial"이라는 미션 아래, 누구나 AI 기술의 혜택을 누릴 수 있도록 '적용이 쉬운 AI 솔루션'을 개발하고 있습니다. 세계 최고 수준의 AI 모델을 다양한 분야에서 손쉽게 활용할 수 있는 API 시리즈를 출시하여 기업 고객들의 비즈니스 성공에 기여하고 있습니다. 또한, LLM 기술을 비즈니스 환경에 맞게 최적화하여 기업들의 업무 효율과 생산성을 높일 수 있는 Private LLM 서비스를 제공하는 등 AI가 세상에 이롭게 사용될 수 있도록 노력하고 있습니다.
LLM 기술과 더불어 Document Parse와 Information Extraction 등의 제품을 통해 문서 처리 분야에서 혁신을 이루고 있으며, 자체 LLM 및 Chat AI 기술을 비즈니스 환경에 맞게 최적화하여 기업들의 업무 효율과 생산성을 높일 수 있는 AI Space를 개발하는 등 업무 환경의 미래를 위한 인텔리전스를 만들어 갑니다.
"AI를 세상에 쏘아 올리는 발사대, Platform 팀"
업스테이지 Platform 팀은 세계 최고 수준의 AI 모델과 서비스가 가장 빠르고 안정적으로 고객에게 닿을 수 있도록 돕는 핵심 엔지니어링 조직입니다. 우리는 "Platform as a Product"라는 철학 아래, 내부 개발자가 인프라의 복잡함을 느끼지 않고 비즈니스 로직과 모델링에만 집중할 수 있는 Golden Path(표준화된 개발 경로)를 만듭니다.
단순한 운영을 넘어, LLM/ML 서비스에 특화된 GPU 스케줄링, 글로벌 멀티 리전 아키텍처, 그리고 고도화된 Self-Service Platform을 통해 엔지니어링의 생산성을 극대화합니다. 유연하고 수평적인 문화 속에서 최고의 동료들과 함께 글로벌 스케일의 AI 플랫폼을 함께 만들어갈 분을 찾습니다.
주요 업무
Internal Developer Platform (IDP) 구축 및 고도화: 개발자가 인프라를 쉽고 안전하게 프로비저닝할 수 있도록 셀프 서비스 플랫폼을 개발하고, 개발의 시작부터 배포까지의 경험(DevEx)을 지속적으로 개선합니다.
Kubernetes 기반 플랫폼 엔지니어링: EKS 및 On-Premise 환경을 아우르는 하이브리드 Kubernetes 클러스터를 운영하며, GPU 리소스 스케줄링 최적화 및 모델 서빙 안정성을 확보합니다.
Global Multi-Region 인프라 아키텍처 설계: 데이터 주권 및 글로벌 서비스 확장에 대응하기 위해 Multi-Region 네트워크 및 인프라 아키텍처를 설계하고 운영합니다.
Infrastructure as Code 기반 자동화 및 모듈화: Terraform, Ansible 등을 활용하여 모든 인프라를 코드로 관리하고, 재사용 가능한 인프라 모듈을 개발하여 운영 효율을 높입니다.
Observability 체계 구축 및 SLO 기반 운영: Logging, Metrics, Tracing 파이프라인을 구축하여 플랫폼의 가시성을 확보하고, SLO/SLI 기반의 데이터 중심 운영 문화를 정착시킵니다.
CI/CD 파이프라인 및 배포 전략 고도화: ArgoCD, Github Actions 등을 활용하여 GitOps 기반의 배포 파이프라인을 구축하고, Canary/Blue-Green 등 안정적인 배포 전략을 제공합니다.
근무형태
정규직
모집절차
서류 전형
알고리즘 코딩 테스트
기술 인터뷰
컬처 인터뷰
최종 인터뷰
최종 결과 발표
*절차는 상황에 따라 조정될 수 있습니다.
*최종 인터뷰 후, 레퍼런스 체크 절차가 진행될 수 있습니다.
근무환경
Anywhere On Earth But Together! ‘어디서든’ 함께 일할 수 있습니다.
원격 근무에 필요한 장비를 500만원 예산 내에 자유롭게 선택하실 수 있습니다.
근무를 위한 카페 이용 시 음료 비용, 스터디룸 혹은 공유오피스 이용 비용 등을 지원해드립니다.
업무 관련 소프트웨어, 도서, 자료, 교육 및 어학 수강비 등 성장에 필요한 비용을 지원해드립니다.
건강을 위한 운동비, 직장 단체보험 및 종합건강검진을 지원해드립니다.
필수사항
AWS, Azure등 Public Cloud 환경에서 대규모 서비스 운영 경험 (EKS, VPC, IAM, Transit Gateway 등)
Kubernetes 생태계에 대한 깊은 이해 및 운영 경험 (Architecture, CNI, CSI, CRD 등)
Terraform, Ansible 등을 활용한 IaC(Infrastructure as Code) 모듈 설계 및 운영 경험
서비스 운영/장애 대응 경험 및 관측성(Observability)에 대한 깊은 이해
플랫폼을 '제품'으로 바라보고, 고객(내부 개발자)의 문제를 정의하고 해결하려는 Product Mindset을 보유하신 분
다양한 직군(개발자, 모델러, PM 등)과 원활하게 소통하며 문제를 주도적으로 해결할 수 있는 커뮤니케이션 역량
우대사항
LLM/ML 인프라 구축 또는 GPU 기반 모델 서빙 환경 경험
대규모 트래픽 처리를 위한 고가용성(HA) 아키텍처 설계 및 Multi-Region / Global Service 운영 경험
DevEx 개선, Internal Platform/IDP 구축 경험
Cloud Native 기술(Service Mesh, Operator Pattern, ArgoCD, KEDA 등)에 대한 깊은 이해와 실무 적용 경험
SLO/SLI/Error Budget 기반의 SRE 문화 도입 및 실천 경험
FinOps 관점에서 클라우드 비용 효율화 및 리소스 최적화 경험
—
*관련 문의사항은 [email protected]로 문의 부탁드립니다.
*CV를 포함한 모든 제출 자료는 PDF 형식으로 업로드 해주시기 바랍니다.
*지원자의 민감 정보(연봉 정보, 주민번호 등) 및 고유식별번호는 이력서에 기재하지 않도록 유의해주시기를 바랍니다.
Please mention you found this job on AI Jobs. It helps us get more startups to hire on our site. Thanks and good luck!
Understand the required skills and qualifications, anticipate the questions you may be asked, and study well-prepared answers using our sample responses.
Software Engineer Q&A's