CTW is hiring a

Site Reliability Engineer (SRE) - (on behalf of Tuwaii)

Shanghai, China
Full-Time

▍ 工作内容:

  • 设计、开发和维护高可靠性、可维护性和可扩展性的云原生系统、与平台及游戏开发团队高效沟通。
  • 设计、开发和维护平台的自动化工具、CI/CD和运维流程,保证应用的快速部署与系统的高可用性。
  • 设计、开发和维护平台基于公有云与K8s搭建的各PaaS系统、加速平台应用与游戏的上线。
  • 分析并优化各系统性能、集群配置和故障模式,并落地最佳实践。
  • 监控平台与游戏各系统,及时响应并解决生产环境中的问题,减少故障恢复时间。
  • 参与轮班值守,及时响应紧急事件,并进行事后分析以防止问题再发。
  • 编写和维护技术文档,包括系统架构、运维SOP、游戏对接、故障处理指南等。

Requirements

▍ 基本要求:

  • 计算机科学、信息技术或相关专业毕业。
  • 至少3年以上使用 Kubernetes 的经验,熟悉 Kubernetes 的架构、原理和操作。
  • 精通至少一种编程语言(如 golang, python等)。
  • 有在生产环境中使用监控工具(如 Prometheus、Grafana)的经验。
  • 具备故障诊断、性能优化和事故处理的实践经验。
  • 良好的项目管理和沟通能力。

▍ 优先考虑:

  • 有使用云服务(如 AWS 或 Aliyun)的经验。
  • SRE 认证或相关领域的专业认证。
  • 有领导小团队或项目的经验。

Benefits

  • 五险一金
  • 免费饮料和零食
  • 免费午餐
  • 海外研修交流机会
  • Working hours: 9:00 - 18:00, in-office


Tuwaii(上海途未科技)是一家专注于利用人工智能(AI)革新游戏产业的初创公司。我们积极与海外的合作伙伴共同开发H5游戏平台,并与知名动漫品牌合作,致力于推广和发扬各种二次元文化IP。

我们的游戏平台已成功推出30款以上精选二次元动画的游戏作品。我们的游戏玩家遍布全球,每月有超过200万玩家访问我们的游戏平台,总计高达数亿次的广告曝光。

我们采用先进的大语言模型(LLM)和人工智能生成技术(AIGC)来持续优化我们的游戏产品和业务,包括以下多个游戏业务领域:

  • 海外广告投放
  • 海量数据分析
  • 游戏素材制作
  • 全球支付平台
  • 认证平台
  • 游戏内容国际化
  • 游戏系统云原生化

我们诚邀您加入我们的团队,使用AI的力量,共同打造行业领先的游戏平台和产品,推动行业的发展。

Apply for this job

Please mention you found this job on AI Jobs. It helps us get more startups to hire on our site. Thanks and good luck!

Get hired quicker

Be the first to apply. Receive an email whenever similar jobs are posted.

Ace your job interview

Understand the required skills and qualifications, anticipate the questions you may be asked, and study well-prepared answers using our sample responses.

Site Reliability Engineer Q&A's
Report this job
Apply for this job