牛大妈在社招职位搜索微信-WeLM 大模型预训练框架研发工程师深圳上海 有 4 条结果

招聘城市:北京
…Megatron, DeepSpeed 等大规模训练框架使用经验者优先;
5.对RL/RLHF、偏好学习、奖励建模有实践经验者优先;
6.具备扎实的工程实现能力与代码规范意识,熟悉CUDA优化、参数并行、流水线并行等技术;
7.具备良好的团队协作与沟通能力,热爱探索与创新。
加分项:
1.在 GitHub 等平台持续参与主流模型 / 分布式训练 / RLHF 等项目的开发维护,有高质量 PR 被核心项目合并,或担任 maintainer / reviewer;
2.主导或深度参与自研训练 / 后训练框架、长上下文训练工具链等开源项目,具备清晰的技术文档与使用教程,拥有一定 Star / Fork 规模和社区用户;
3.在 Hugging Face 社区、技术博客或开发者论坛上定期分享工程实践(如长上下文训练、MoE…
招聘城市:北京
岗位职责:
参与大规模语言模型WeLM)的建设,涵盖训练流程的多个环节
1.探索大规模训练模型的结构创新、优化器策略创新,提升单位算力下的智能获取效率
2.探索更高效全面的训练数据建设方案、训练数据使用方案
3.建设通用 Long-Horizon LLM Agent 的训练策略
4.独立或与其他研究员合作进行前沿领域研究。
岗位要求:
1.有大型自然语言处理项目研发经历并取得过优秀成果
2.对于学习和参与搭建大规模的复杂 AI 系统充满热情
3.计算机科学、数学、物理或相关领域学位
4.重视研究与工程成果的实际影响力
加分项:
a.能在快速变化的环境中自主推动新研究想法,从概念构思、实验到产品…
招聘城市:北京
岗位职责:
参与大规模语言模型WeLM)的建设,涵盖训练流程的多个环节
1.探索大规模训练模型的结构创新、优化器策略创新,提升单位算力下的智能获取效率
2.探索更高效全面的训练数据建设方案、训练数据使用方案
3.建设通用 Long-Horizon LLM Agent 的训练策略
4.独立或与其他研究员合作进行前沿领域研究。
岗位要求:
1.有大型自然语言处理项目研发经历并取得过优秀成果
2.对于学习和参与搭建大规模的复杂 AI 系统充满热情
3.计算机科学、数学、物理或相关领域学位
4.重视研究与工程成果的实际影响力
加分项:
a.能在快速变化的环境中自主推动新研究想法,从概念构思、实验到产品…
招聘城市:北京
岗位职责:
参与大规模语言模型WeLM)的建设,涵盖训练流程的多个环节
1.探索大规模训练模型的结构创新、优化器策略创新,提升单位算力下的智能获取效率
2.探索更高效全面的训练数据建设方案、训练数据使用方案
3.建设通用 Long-Horizon LLM Agent 的训练策略
4.独立或与其他研究员合作进行前沿领域研究。
岗位要求:
1.有大型自然语言处理项目研发经历并取得过优秀成果
2.对于学习和参与搭建大规模的复杂 AI 系统充满热情
3.计算机科学、数学、物理或相关领域学位
4.重视研究与工程成果的实际影响力
加分项:
a.能在快速变化的环境中自主推动新研究想法,从概念构思、实验到产品…