职位描述
职位描述
1、模型评测:与团队一起建设科学、客观、可操作的大模型评估框架,并设计具体评测工具量化评估模型效果;
2、数据生产:理解不同Al角色的理想态,包含人格、语言风格、沟通模式等,进行模型测评及训练数据的产出;
3、自动化提效:优化模型评测效率,搭建自动化评测及数据生产体系,探索创新型算法评测方法;
4、创新探索:探索LLM技术在各类实际用户场景和需求中的应用和落地。
职位要求
1、本科以上学历,心理学、社会学、语言学等相关专业背景优先;
2、高情商、会聊天、对文字敏感度高,有良好的创作能力和深入对话能力者优先;
3、深度使用各类AI产品,对大模型技术应用抱有强烈热情;
4、了解LLM和对话型AI原理,对预训练语言模型、精调和提示过程等大模型底层技术有一定理解者优先。