职位描述
职位描述:
1. 探索在任务型对话系统中使用大语言模型和相关agent/multi-agent框架,持续追踪、复现前沿文献、项目中方法;
2. 收集、清洗模型训练所需多轮对话数据;
3. 构建模型训练、效果评估pipeline,包括post pre-training、SFT、RLHF等阶段,优化训练策略等;
4. 定量、定性评估模型效果,横评不同基座模型效果。
职位要求:
1. 计算机相关专业本科学历以上,每周实习时间能保证3天以上;
2. 熟悉NLP、深度学习常用模型和方法;
3. 熟悉Python、Java、C++等常用编程开发语言,有云端工程开发经验;
4. 熟悉预训练语言模型训练相关技术,有微调、强化学习等相关经验者为佳;
5. 熟悉大语言模型应用开发流程,了解LangChain、AutoGPT、Autogen等框架,熟悉prompt工程、检索式生成、大模型工具调用。有实际应用开发经验者为佳;
6. 对ChatGPT、Claude、Copilot等前沿大语言模型产品有浓厚兴趣,愿意自主调研和使用;
7. 有任务型对话管理、对话状态追踪等相关算法背景及应用经验者为佳。