职位描述
工作职责
-针对大模型计算需求,研究基础设施层面对应的优化方案,推进大模型计算优化方案的设计与实现,完成优化相关的对比实验、数据分析与论文撰写
-针对大模型训练性能做量化分析,建立各种并行策略的性能模型,设计最优并行策略的搜索算法,快速找到领先专家的并行策略,大幅度提升大模型训练效率
-结合量化模型分析各AI芯片的特点,形成芯片优化的思路与方案,结合芯片特点,在深度学习框架中实现较好的多芯适配抽象
-在多种芯片组成的混合集群上优化深度学习框架的并行效率;结合芯片与通信特点,探索多芯混合训练的最优并行策略
任职资格
-高性能计算、高性能网络、深度学习系统、体系结构等专业在读硕士、博士,研究方向与AI计算相关
-具备基础代码能力,能独立完成原型实现、实验设计与数据分析
-有CCF A、B类会议/期刊论文发表经验优先
-可实习3个月以上,有相关实习经验优先
工作地点
北京市/北京市/海淀区 方舟大厦 中关村软件园15号