ML/MLOps in Data

AI overview

Contribute to the development of scalable data pipelines for machine learning and video analytics, focusing on computer vision tasks and collaborating with cross-functional teams.
Ajax Systems — міжнародна технологічна компанія, найбільший в Європі розробник і виробник систем безпеки із можливостями розумного дому. Це ціла екосистема зі 180 пристроїв, мобільних і десктопних застосунків, серверної інфраструктури. Data Engineer приєднається до Data-команди, що займається підготовкою та обробкою даних для машинного навчання та відео аналітики. У цій ролі спеціаліст відповідатиме за розробку і підтримку масштабованих конвеєрів даних, особливо в частині, що стосується задач комп’ютерного зору.  Основні обов’язки: - Проєктування та реалізація end-to-end пайплайнів для збору, збереження, обробки та передачі даних (зображень, анотацій тощо) для тренування та валідації моделей глибокого навчання. - Підготовка та вдосконалення великих датасетів для Computer Vision: очистка даних, аугментація зображень, балансування вибірок, приведення анотацій до потрібного формату. - Налаштування та керування інструментами оркестрації пайплайнів (Dagster, Apache Airflow або аналогічні) для автоматизації ETL/ELT процесів. - Інтеграція з хмарною інфраструктурою (AWS) для зберігання даних (наприклад, Amazon S3) та виконання обчислень; забезпечення ефективної доставки даних у середовище навчання моделей. - Використання фреймворків глибокого навчання (наприклад, PyTorch або TensorFlow) для підготовки та первинного аналізу даних; можливе створення допоміжних скриптів для запуску тестових навчань або обчислення ембеддінгів. - Співпраця з командами машинного навчання та розробниками CV-моделей: забезпечення, щоб дані відповідали вимогам моделей, участь у процесі відлагодження моделей через покращення даних. - Впровадження кращих практик щодо якості даних та версіонування датасетів; моніторинг якості даних на кожному етапі пайплайну. - Співпраця з командою розмітки для забезпечення доставки якісних даних. Необхідні скіли: - Досвід (2+ роки) в галузі Data Engineering або суміжній сфері. Впевнене володіння мовою Python та основними бібліотеками для обробки даних (Pandas, NumPy тощо) та зображень (OpenCV, PIL). - Практичний досвід побудови ETL/ELT конвеєрів обробки даних; вміння працювати з системами оркестрації (Dagster, Apache Airflow або подібні) для автоматизації дата-процесів. - Комп’ютерний зір (CV):  практичний досвід роботи з наборами даних (COCO, YOLO), форматами анотацій і їх конвертацією. розуміння роботи інструменту для розмітки даних. вміння розгорнути готову модель CV (детекція, сегментація, класифікація) з відкритих репозиторіїв чи pre-trained чекпоїнтів, адаптувати під власні дані й інтегрувати в пайплайн; досвід роботи з PyTorch або TensorFlow для fine-tuning, інференсу та підготовки даних; розуміння transfer learning і адаптації архітектур під конкретні задачі. - Трансформери та VLLM, Vision Transformers (ViT): практичний досвід використання сучасних архітектур (ViT, DETR, Segment Anything тощо); робота з VLLM (large vision & language models); застосування для автоматизації обробки даних (генерація додаткової розмітки, валідація анотацій, класифікація чи попередній відбір даних). - Навички оптимізації та відлагодження pipeline: моніторинг, логування, усунення неполадок у процесі обробки даних. - Інструментарій: впевнена робота з системою контролю версій (Git), Docker/Kubernetes, а також базове розуміння MLOps практик MLflow/DVC. Буде плюсом: - Розуміння хмарних технологій, зокрема сервісів AWS для роботи з даними (S3, RDS/Redshift, Lambda, IAM тощо); досвід побудови та підтримки дата-процесів у хмарному середовищі. - Знання SQL та досвід роботи з PostgreSQL; оптимізація запитів, робота з великими масивами даних; базові знання NoSQL або Data Warehouse систем — плюс. Пропонуємо: - можливість пропонувати та реалізовувати власні ідеї, які мають вплив на продукт і виробництво; - роботу у вмотивованій команді та zero bullshit culture; - гнучкий графік роботи в офісі (Київ); - конкурентну заробітну плату; - медичне страхування; - корпоративну англійську мову; Ajax — свобода бути інженером!

Perks & Benefits Extracted with AI

  • Flexible Work Hours: Flexible work schedule in the office (Kyiv)
  • Health Insurance: Medical insurance
  • Corporate English classes: Corporate English language classes

Ajax Systems is a leading European security company offering award-winning wireless alarm systems for home security and automation.

View all jobs
Get hired quicker

Be the first to apply. Receive an email whenever similar jobs are posted.

Report this job
Apply for this job