Site Reliability Engineer

TLDR

Engage in managing Kubernetes-based platforms, enhance system reliability, and collaborate across teams while automating processes and contributing to innovative technology projects.

  • Kubernetes‑alapú platform üzemeltetése
  • Klaszterek és node‑ok napi szintű kezelése (upgrade, patch, node cordon/drain, skálázás).
  • Perzisztens tárolás (pl. CSI/Longhorn jellegű megoldás) üzemeltetése, alap szintű kapacitás‑tervezés.
  • Megbízhatóság és SLO‑k támogatása
  • Részvétel SLI/SLO‑k kialakításában és monitorozásában.
  • Error budgetek követése, incidensek és trendek visszacsatolása a csapat felé.
  • Observability és incident management
  • Monitoring és loggyűjtő rendszerek használata és alap konfigurálása (dashboardok, riasztások).
  • Részvétel on‑call rotációban: riasztások elsődleges kezelése, incidensek elhárítása runbookok alapján.
  • Automatizáció és runbookok
  • Deployment és konfiguráció automatizálásának támogatása (CI/CD, Git‑alapú folyamatok).
  • Runbookok, üzemeltetési leírások készítése és karbantartása.
  • Több szervezeti egység közötti együttműködés
  • Napi munka során együttműködés mind a fejlesztői, mind az üzemeltetési és üzleti szereplőkkel.
  • Javaslatok megfogalmazása a folyamatok és a platform megbízhatóságának javítására.

Requirements

  • Legalább 2–3 év tapasztalat Linux‑alapú rendszerek üzemeltetésében.
  • Gyakorlati tapasztalat konténerizált környezet (Docker) és Kubernetes használatában, lehetőleg éles környezetben.
  • Tapasztalat valamelyik monitoring/logging stackkel (pl. Prometheus/Grafana, ELK, Zabbix, stb.).
  • Alapszintű tapasztalat CI/CD rendszerekkel és Git‑alapú munkafolyamatokkal (Gitea, ArgoCD).
  • Cloud Native alkalmazás stack (linunx, ubuntu, containerd, docker, k8s, prometheus/grafana stack, ELK stack, zabbix,mq (rabbit) , minio, postgre) üzemeltetési szintű ismerete
  • Készen áll részt venni on‑call rotációban, strukturált hibakeresési gondolkodással.
  • Jó kommunikációs készség, együttműködés több csapat és szervezeti egység között.

Benefits

  • Változatos, modern technológiákon alapuló projektek
  • Innovatív, stabil hátterű vállalat
  • Éves szinten 5 plusz szabadnap (nem contractor státuszban)
  • Szakmai eseményeken, workshopokon, hackathonokon való részvétel
  • Rugalmas munkaidő és barátságos légkör
  • Csapatépítő programok, közös kikapcsolódási lehetőségek
  • Valódi hatás a termékekre és az ügyfelekre

Benefits

Flexible Work Hours

Rugalmas munkaidő és barátságos légkör

Team-building events and leisure activities

Csapatépítő programok, közös kikapcsolódási lehetőségek

MP Solutions Ltd. is a professional staffing service provider specializing in recruitment process outsourcing (RPO) and IT consulting. We cater to businesses seeking high-quality recruitment and software development solutions, leveraging over two decades of experience to deliver tailored, effective outcomes across Europe and the U.S.

View all jobs
Ace your job interview

Understand the required skills and qualifications, anticipate the questions you may be asked, and study well-prepared answers using our sample responses.

Site Reliability Engineer Q&A's
Report this job

This job is no longer available