职位概述
- 岗位内容:
1.负责运维团队的建设和培养,带领运维团队保障各软件平台的正常稳定运行和应急响应;
2.提供前瞻性的云资源管理、高可用设计、安全合规等工作;
3.积极参与业务方案讨论与设计,并推进优化服务的响应延迟、性能问题,提升服务可用性;
4.完成CI/CD系统建设,服务的变更管理、灰度发布、容量规划及对应自动化运维平台建设;
5.实行事故应急机制,参与及推进事故本质原因的调查及改进;
6.主导解决应用运维工作中重大故障、性能瓶颈等相关疑难问题。
任职要求:
1.5年以上运维工作经验,需要有云服务运维经验;
2.熟悉 Docker容器、Kubernetes相关技术,至少3年以上K8s自动化运维经历;
3.熟悉Linux系统,拥有极强的排查、解决问题的能力
4.熟悉 Ansible/Slatstack/puppet 任意一种相关批量配置管理工具;
5.熟悉 Python/Go/Ruby/Perl 等一种或以上脚本语言;
6.熟悉 Zabbix、Prometheus等常用监控工具;
7.熟悉 ELK、Nacos、Redis、Kafka、Nginx等常用组件。
|