【關於 Pinkoi Data Squad】
我們是 Pinkoi 的資料團隊,其目標為打造有效的數據平台,同時確保資料的品質與穩定性,讓資料在 Pinkoi 發揮最大的價值。Data Engineer 將與 Business Analyst/ML Engineer 緊密合作,透過數據探索問題、規劃後續的 Data Pipeline(資料管線) 實作,並提供 End-to-end 的 Data Solution,以擴展公司各部門的數據分析能力,並完善整體商業智慧系統。
你需要負責的工作內容
與產品、行銷、廣告等分析師與商業團隊合作,理解需求並規劃合適的 Data Pipeline。
設計、實作與維護 ETL/ELT 流程,確保資料品質、穩定性與新鮮度。
建立與優化資料模型,支援報表、分析與機器學習等多種場景。
持續迭代並優化資料基礎建設,提升可擴展性與維運效率。
建立監控與告警機制,確保 Pipeline 成功率與資料 SLA。
我們希望你有的經驗跟特質
對 Big Data 和 Data-driven engineering 有極大的熱情。
瞭解 ETL 或 ELT 的流程,並具備 Data Modeling 跟開發 Data Pipeline 的能力。
具備與產品 / 行銷團隊合作的經驗,並可與商業分析師、資料工程師,以及機器學習工程師協同合作。
樂於學習最新的技術,隨時充實自我的專業技能。
對大型語言模型(LLM)保持開放與好奇,願意學習並嘗試將其應用於資料工程工作(如:資料清理、欄位補全、文件生成、自動化測試),以探索新工具如何提升效率與使用者體驗。
應徵條件
數學 / 統計 / 資訊 / 資料科學相關科系畢業,或具備同等專業能力。
一年以上數據分析或數據工程相關工作經驗。
熟悉 Python、Scala、Java 等任何一種程式語言,Pinkoi 主要用 Python。
熟悉 GNU/Linux 系統,Pinkoi 用 Ubuntu。
熟悉關聯式資料庫的運用,例如 MySQL。
加分條件
熟悉廣告歸因邏輯,或具備相關數據處理經驗。
具備使用者行為數據處理經驗。具有操作或架設 BI 工具的相關經驗。
如 Superset、Tableau、Looker Studio,Pinkoi 使用 Superset 和 Redash。
具有分散式運算的相關知識,例如 Spark、Hadoop、Hive 等一種或多種相關技術,Pinkoi 主要用 PySpark。
熟悉雲端服務,例如 AWS Athena、S3、Glue,GCP BigQuery 等,Pinkoi 主要用 AWS。
了解 dbt 的基礎架構和應用方式,如建立資料模型、撰寫測試、建立巨集等等。
有將 LLM 應用於資料工程場景的經驗,例如規則抽取、欄位對齊與補全、文件/Data Catalog 生成、資料品質檢查等。
#不用想了,趕快來當個 Pinkoi 人
如果你有信心能夠勝任這份工作,歡迎提供你的個人履歷與小作業,即刻應徵!