职位描述
工作职责:
1. 信息收集与整理:搜集并整理关于文心一言、GPT等前沿通用大模型的应用场景、职业领域划分以及市场热点信息。结合内外部的行业标准和市场趋势,协助团队动态更新大模型的使用场景分类和产品力评估维度,确保星火始终站在行业前沿。
2. 大模型能力评测:定期对文心一言、GPT、Kimi等主流大模型进行深度评测,涵盖其通用能力、性能表现、兼容性等多个方面。主要负责生活、商务沟通、文档解读、教育学习以及多模态交互等场景下的测试和分析。
3. 评价标准与测试用例库建设:基于持续的测试实践,协同团队不断完善评价标准体系,并丰富测试用例库。
任职要求:
1.对人工智能领域充满热情,并愿意投入时间和精力进行研究,使用过讯飞星火、文心一言等大模型产品者优先。此外,具备较强的产品意识和用户体验敏感度。
2.外语、法律、教育、数学等相关专业本科及以上学历。
3.具备良好的团队协作精神和沟通能力,能够与其他测试同事进行高效协同,快速完成测试活动。
工作地点
安徽省/合肥市/蜀山区 科大讯飞语音产业基地 高新技术产业开发区望江西路666号