职位描述
【岗位职责】
1.负责生成式文本、代码大模型预训练、微调、强化学习相关的工作,包括但不限于:大规模模型预训练、Prompt Engineer、PPO算法优化;
2.探索与跟进前沿技术,寻求技术突破,推动机器在AIGC能力的提升和突破;
【岗位要求】
1.熟练掌握Python,熟悉Linux环境开发,精通应用深度学习框架DeepSpeed, Megatron;
2.持续跟进前沿的深度学习技术,了解前沿的深度学习相关算法,熟悉Transformer等模型结构;
3.有大规模模型预训练实践经验者或有较强的研究能力在机器学习领域顶级会议发表过高质量论文者优先。
工作地点
北京市/北京市/朝阳区 平安国际金融中心 新源南路1号