职位描述
职位描述
1、保障抖音电商多个核心系统的可靠性与正常运行,同时关注系统容量与稳定性;
2、为大型系统构建自动化运营解决方案,从系统设计到上线的整个生命周期内保障系统可靠性;
3、通过全方位的数据运营(包括系统组件可用性、性能指标等)提升系统可见性,帮助系统开发以及团队快速定位故障;
4、推动提升服务的可靠性、可扩展性以及性能优化,保障系统 SLA;
5、基于业务使用场景,深入优化提供最佳服务治理实践,包含不局限于关键链路性能瓶颈分析、业务问题定位排障、推进系统高可用架构改造升级等。
职位要求
1、本科及以上学历,计算机相关专业,有互联网运维工作经验;
2、扎实的计算机软件基础知识,了解Linux操作系统、存储、网络 IO等相关原理;
3、熟悉一种或多种编程语言,例如Python/Go/Java/Shell/C++等;
4、具备系统化解决问题的能力,良好的沟通技巧和主人翁责任感;
5、具有相关接入/计算/存储等系统经验优先(Nginx/Kubernetes/Docker/Redis/Mysql/RMQ等)。