DevOps 工程师

Tokyo, Japan
岗位职责:
- 负责公司全球多区域基础设施的搭建与维护,包括 AWS/GCP 混合云架构的设计与实施
- 优化 CI/CD 流水线,提升自动化部署效率和系统稳定性
- 完善监控告警体系,确保系统运行的高可用性和安全性
- 参与 on-call 轮值,能够快速响应生产环境中的突发事件,并进行事故复盘和总结
任职要求:
- 具备 3 年以上 SRE/DevOps 相关工作经验
- 熟练使用 Terraform、Kubernetes、Prometheus 等主流工具
- 有 GPU 集群管理经验者优先考虑
- 具备良好的生产事故快速响应和复盘能力