职位描述
岗位职责:
1、负责专用大模型的模型开发、效果调优,使平台上的模型算法保持领先
2、负责LLM、深度学习、机器学习、脑与类脑科学等方向相关问题研究,跟进前沿技术动态
3、负责设计、构建大模型的特定下游任务以及针对特定任务的算法fine-tuning及加速
岗位要求:
1、计算机或人工智能相关专业本科及以上学历,有顶会论文可加分;
2、对脑科学、神经科学有兴趣,有相关学习研究经验者优先;
3、熟悉至少一种深度学习框架(PaddlePaddle、PyTorch、TensorFlow、Caffe等);
4、熟悉CUDA开发和性能调优可加分;
5、熟悉Deepspeed、Colossalai或Megatron等大模型训练框架者优先;
6、拥有知名学术工作、开源项目、国际竞赛成果者优先。