招聘城市:深圳
…演进;
3.追踪与研究支撑大模型在游戏业务落地的前沿技术,关注基于执行反馈的3、强化学习(RLAIF/RLCE)、代码自验证生成、AI SWE、多模态内容生成、游戏智能体(Game Agent)等方向,能够将最新研究成果快速转化为游戏业务价值。
岗位要求:
1.计算机相关专业,具备较强的动手能力;熟悉 Python ,具备扎实的系统编程功底和优秀的复杂系统 Debug 能力;
2.训练框架经验: 深入理解大模型分布式训练原理,具备 Megatron-LM、DeepSpeed 或 PyTorch FSDP 等主流框架的实际源码级开发与定制经验;
3.RL 与 RL Infra 储备: 熟悉大模型后训练与对齐技术(PPO、GRPO、DPO等),熟悉 Verl、ROLL,AReal 等强化学习/分布式计算框架,可以理解并解决 RL过程中的工程痛点…
…演进;
3.追踪与研究支撑大模型在游戏业务落地的前沿技术,关注基于执行反馈的3、强化学习(RLAIF/RLCE)、代码自验证生成、AI SWE、多模态内容生成、游戏智能体(Game Agent)等方向,能够将最新研究成果快速转化为游戏业务价值。
岗位要求:
1.计算机相关专业,具备较强的动手能力;熟悉 Python ,具备扎实的系统编程功底和优秀的复杂系统 Debug 能力;
2.训练框架经验: 深入理解大模型分布式训练原理,具备 Megatron-LM、DeepSpeed 或 PyTorch FSDP 等主流框架的实际源码级开发与定制经验;
3.RL 与 RL Infra 储备: 熟悉大模型后训练与对齐技术(PPO、GRPO、DPO等),熟悉 Verl、ROLL,AReal 等强化学习/分布式计算框架,可以理解并解决 RL过程中的工程痛点…