职位描述
工作职责:
1、面向多模态场景的需求分析及算法研究,包括但不限于多模态表示学习、多模态预训练等;
2、设计融合文本、图像等多模态信息的技术方案,如基于多模态的文本生成、文本指导的图像生成,跨模态检索等;
3、负责追踪调研多模态前沿问题和学术界动态,并结合实际场景提供技术解决方案。
任职要求:
1、统招硕士及以上学历,计算机/数学/统计等相关专业;
2、熟悉Linux开发环境,熟练掌握Python/C#等一门或多门编程语言;
3、熟练掌握NLP/CV领域常用的算法模型原理和常用工具,熟悉Pytorch、Tensorflow等深度学习框架;
4、有大规模预训练项目经验优先;
5、有多模态相关的项目经验优先;
6、在NLP或CV等领域顶会(ACL/EMNLP/NIPS/ICML/AAAI/CVPR/ECCV等)有发表过论文的优先;
7、热衷于技术钻研,良好的自我学习能力和自驱力,良好的沟通能力和团队协作能力;
8、实习时间:至少3个月以上,一周三天以上,工作地点:上海、北京、苏州,特殊情况可接受远程。
工作地点
北京市海淀区中关村北四环67号国际创新大厦