职位描述
职位描述:
1、负责字节跳动数据平台Clickhouse/Doris等OLAP产品的SLA体系,容灾体系的建设,故障的自愈等,保障业务的持续可用;
2、为字节跳动集团的所有使用Clickhouse/Doris的业务持续提升服务质量,提升用户体验;
3、优化oncall的服务效率, 和产研团队直接合作,推进客户问题的解决,以及产品的持续优化;
4、负责字节跳动大数据产品的SRE平台的研发、自动化建设与持续迭代,引导产品的运维模式向数字化,智能化方向发展演进。
职位要求
1、计算机相关专业,本科及以上学历;
2、3年及以上大数据OLAP领域SRE运维工作经验,熟悉OLAP的运维体系建设与稳定性保障。熟悉一个或多个开源组件,如:Clickhouse/Doris/StarRocks/K8s/Spark/Presto/Hadoop等;有实际的大数据商业应用开发运维经验为加分项;
3、熟悉Linux、网络等系统运维的技能,具备运维问题分析、应急解决以及性能调优等能力;
4、对大数据产品问题排查有实际的工作经验,面对线上大数据产品问题有清晰排查思路,具备快速定位问题能力;
5、熟悉至少一门编程语言,包括但不限于:Shell、Python、Java、Scala等;
6、具备良好的沟通表达、团队协作以及自驱能力,促进跨团队的合作。