职位描述
工作亮点
1. 背靠清华大学自然语言处理实验室,有国内顶尖NLP技术支持;
2. 目标远大:做国内最好的大规模中文预训练语言模型;
3. 团队有自研大规模中文预训练模型经验,有深厚的NLP知识积累;
4. 能与学术牛人一起交流讨论,探索最前沿的技术。
加入我们!一起探索前沿科技,共同打造基于大模型的新一代智能信息处理平台。
岗位职责
1. 深度参与面向公司产品的人工智能算法研发,包括但不限于语义理解、自动摘要和可控文本生成;
2. 调研相关前沿技术,根据需求复现和优化相关算法,推动前沿技术的实际落地;
3. 参与公司中文大规模预训练模型的训练、微调、推理和部署。
任职要求
1.熟悉NLP基础理论和算法,熟悉Transformer系列模型;
2. 熟悉Python语言开发,熟练使用PyTorch、TensorFlow等至少一种深度学习框架;
3. 工作认真负责,有热情,有一定的抗压能力;
加分项
1. 有NLP相关项目和研究经验者优先;
2. 在ACL、EMNLP、NeurIPS、ICLR和NAACL等相关会议发表过论文者优先。
工作地点
北京市/北京市/海淀区 东升大厦C座 中关村东路8号东升大厦