职位描述
职责描述:
1. 负责基座模型预训练、指令微调训练和强化学习
2. 负责模型结构和训练策略的优化,提升训练效率和推理效率
3. 协同跨团队技术和业务同学共同达成技术和业务目标
4. 跟进最新的学术进展,及时掌握大模型的前沿技术
任职要求:
1. 计算机相关专业获得硕士学位, 博士优先, 发表过大模型相关研究AI顶会论文优先;
2. 对NLP主流大模型如GPT3/chatGPT/T5/PaLM/LLaMA/GLM等的原理和差异有深入的理解;
3. 熟练掌握主流深度学习框架pytorch/tensorflow,大模型训练框架Megatron-LM/Deepspeed等多机多卡方案,有百亿/千亿NLP大模型训练调优经验优先;
4. 有良好的代码开发能力,有开源项目开发经验优先。