职位描述: 1.全面负责公司运维体系升级、扩容及资源优化,并提供自动化程度较高的网络与服务平台。2.负责公司各应用系统的日常运维、性能分析、服务监控和告警处理等,通过自动化流程不断提高系统的运行效率。3.负责线上上千台机器规模的应用和大数据系统的技术运维。4.设计实现可支撑大规模分布式集群的运维工具。5.设计实现完善的监控系统,通过技术研发、运维保障、架构优化持续性提升服务可用性及各类技术指标。职位要求: 1.计算机相关专业硕士以上学历。2.能够制定并实施运维体系的长期规划,具备很强的全局架构能力。3.熟悉Docker、Kubernetes、KVM等虚拟化技术,对监控、部署、调度、虚拟化等有深入理解。4.熟悉AWS、阿里云等云计算产品和服务,有大规模云计算平台相关经验。5.具备强烈的责任心和良好的团队合作精神,对所负责工作有强烈的owner意识,并能持续自我驱动成长。6.具备较强的逻辑思维能力、学习创新能力、数据分析能力,性格开朗,有较强抗压能力。7.渴望在工作中实现业务价值,有二十人以上技术团队的实际管理经验者优先。