职位描述
职位描述:
1、负责机器学习推荐等系统的稳定性保障
2、负责机器学习平台稳定性,运维效率相关基础设施建设和架构升级
3、负责相关系统的硬件资源管理与规划,提升资源效率
职位要求:
1、有大型系统的运维管理经验,2年以上相关工作经验
2、精通Linux系统、Shell/Python/C等编程语言、网络TCP/IP协议、数据库等,动手能力强
3、较强的分析和解决问题的能力,强烈责任感、 缜密的逻辑思维能力
4、有较强的系统问题分析经验和能力,能够解决复杂的系统问题
5、有大型云计算公司从业经验、机器学习背景,熟悉开源项目源码优先
6、有监控系统构建研发经验优先
具备以下条件者优先:
1、熟悉至少一种主流深度学习编程框架(TensorFlow/Caffe/MXNet),熟悉其底层架构和实现机制
2、有过开源社区经历