Operations Engineer (all genders)

Cologne , Germany
Remote

AI overview

As an Operations Engineer, ensure reliable operation, monitoring, and deployment of software solutions in complex environments, contributing to a stable 24/7 operation.

Über das Arbeiten bei envelio

Zu einfach ist langweilig! Gemeinsam haben wir die Mission, die Energiewende voranzutreiben. Wir lieben, was wir tun und dabei ist uns kein Thema zu groß. Wir übernehmen Verantwortung für unsere Arbeit und wachsen an jeder neuen Aufgabe. Kurz gesagt: Own it, love it, grow with it.

Wir sind ein bodenständiges Team aus Kaffee- und Mate-Liebhaber:innen. Unser Geek-Humor resultiert in einer rituellen Nutzung von Emojis und der enzyklopädischen Herausarbeitung von unnützem Wissen. Mehr als 150 envelianer:innen mit über 20 verschiedenen Nationalitäten sind bereits an Bord. Komm dazu und wachse mit uns!

Deine Rolle

Als Operations Engineer (all genders) bist du verantwortlich für den zuverlässigen Betrieb, die Überwachung und das Deployment der Softwarelösungen von envelio in komplexen Kundenumgebungen. Du stellst sicher, dass Updates, Bugfixes und neue Versionen der Intelligent Grid Platform (IGP) reibungslos in Cloud-, On-Premise- und Operational-Technology-(OT)-Umgebungen ausgerollt werden.

Ein zentraler Bestandteil deiner Rolle ist der tägliche Betrieb der Kundensysteme, einschließlich der Überwachung der Systemgesundheit, der Bearbeitung von Incidents und der Koordination einer effektiven Incident-Lösung. Du trägst aktiv zu einem stabilen 24/7-Betrieb bei, indem du Probleme frühzeitig erkennst, auf Incidents reagierst und eine klare Kommunikation sowie Übergaben sicherstellst.

Du arbeitest an der Schnittstelle zwischen Engineering, Betrieb und Kunden. In enger Zusammenarbeit mit den IT- und OT-Teams der Kunden hilfst du dabei, Betriebsmodelle zu klären, die bestehende Infrastruktur zu verstehen und sicherzustellen, dass unsere Software zuverlässig und sicher in realen Netzumgebungen läuft.

Wie du etwas bewirkst

  • Du führst Software-Updates, Patches und Bugfixes in Kundenumgebungen aus – sowohl in Cloud-, On-Premise- als auch in OT-Infrastrukturen
  • Du betreibst und wartest Kundensysteme und stellst einen stabilen und sicheren Tagesbetrieb sicher
  • Du trägst zum 24/7-Betrieb bei, indem du an Bereitschaftsdiensten teilnimmst und eine schnelle Reaktionszeit im Falle von Incidents sicherstellst
  • Du unterstützt Kunden bei Rollouts, Upgrades und operativen Incidents – auch außerhalb der regulären Geschäftszeiten, wenn erforderlich
  • Du arbeitest direkt mit Kunden zusammen, um ihre IT- und OT-Landschaften zu verstehen und passende Betriebsmodelle zu definieren
  • Du analysierst operative Probleme und koordinierst Troubleshooting gemeinsam mit Development, SRE und Security Teams
  • Du dokumentierst kundenspezifische Setups, operative Prozesse und Deployment-Verfahren
  • Du trägst dazu bei, Deployment- und Betriebsprozesse kundenübergreifend zu verbessern und zu standardisieren
  • Du unterstützt interne Teams, indem du Feedback aus dem realen Kundenbetrieb in Produkt- und Engineering-Entscheidungen einbringst

Dein Profil

Perfektion ist ein Mythos! Viel mehr interessiert uns der Mensch hinter dem Bildschirm. Diese Kriterien sind also eher als Orientierungshilfe für dich gedacht. Wir sind gespannt, wie deine individuellen Fähigkeiten zu uns passen.
  • Du hast praktische Erfahrung im Betrieb und Deployment von Software in komplexen IT-Umgebungen
  • Du bist vertraut mit Cloud-, On-Premise- und idealerweise OT- oder industriellen IT-Landschaften
  • Du arbeitest gerne eng mit Kunden zusammen und kannst technische Themen klar und pragmatisch erklären
  • Du arbeitest gerne hands-on operativ – von Deployments bis zum Troubleshooting in Produktionsumgebungen
  • Du verfügst über gute Kenntnisse in Linux-basierten Systemen, Kubernetes, Netzwerktechnik und grundlegenden Security-Konzepten
  • Du bist bereit und in der Lage, zum 24/7-Betrieb durch Bereitschaftsdienste im Rahmen einer geteilten Team-Rotation beizutragen
  • Du bist strukturiert, zuverlässig und übernimmst Verantwortung für operative Aufgaben
  • Du arbeitest gut mit Software-Entwicklern zusammen und kannst operative Anforderungen in technische Requirements übersetzen
  • Du bist mit Teilen unseres Tech Stacks vertraut oder traust dir zu, dich schnell einzuarbeiten
  • Du beherrschst Deutsch und Englisch fließend in Wort und Schrift

Wie wir Software entwickeln

  • Klar definierte Verantwortung für Produktthemen und effiziente Koordination zwischen Squads und Customer Success
  • Strukturiertes Incident Management (Service wiederherstellen, klar kommunizieren, dann Ursachenanalyse)
  • Release-Prozesse mit pragmatischem Risikomanagement (sichere Änderungen, schnelle Rollbacks bei Bedarf)
  • Monitoring- und Alerting-Hygiene (signal over noise)
  • Umfassende Runbooks und Automatisierung zur langfristigen Reduzierung operativer Belastung

Unser Tech Stack

  • Multi-cloud, hybrid on-prem Setup mit Kubernetes und Helm als Standard
  • Anwendung primär in Python und TypeScript
  • Standard Backing Services wie PostgreSQL, RabbitMQ, Redis
  • Gitlab & Gitlab CI
  • Terraform für Infrastructure as Code

Deine Benefits

  • Passe den Arbeitsmodus an deinen Lifestyle an – fully remote (#LI-Remote) oder hybrid mit Office-Option
  • Option zum mobilen Arbeiten aus dem Ausland (bis zu drei Monate pro Jahr von überall in der EU oder den USA)
  • State of the Art Technologie und moderner Tech Stack
  • Sehr gute Hardware-Ausstattung (16 Zoll MacBooks, 2 Bildschirme an deinem Arbeitsplatz)
  • 30 Urlaubstage + 3 corporate holidays
  • Unterstützung deiner Gesundheit mit der Urban Sports Club Kooperation
  • Flexible Nutzung eines monatlichen Mobilitätsbudgets (z.B. Jobrad, ÖPNV)
  • Zeit und Budget für individuelles Wachstum
  • optionale Betriebliche Altersvorsorge
  • Regelmäßige Company und Team Events

Perks & Benefits Extracted with AI

  • Regular company and team events: regelmäßige Company und Team Events
  • Fully remote or hybrid work options: Passe den Arbeitsmodus an deinen Lifestyle an – fully remote (#LI-Remote) oder hybrid mit Office-Option
  • Health support with Urban Sports Club cooperation: Unterstützung deiner Gesundheit mit der Urban Sports Club Kooperation
Ace your job interview

Understand the required skills and qualifications, anticipate the questions you may be asked, and study well-prepared answers using our sample responses.

Operations Engineer Q&A's
Report this job
Apply for this job