牛大妈在社招职位搜索微信小游戏-大模型后训练工程师 有 2 条结果

招聘城市:深圳
…演进;
3.追踪与研究支撑模型在游戏业务落地的前沿技术,关注基于执行反馈的3、强化学习(RLAIF/RLCE)、代码自验证生成、AI SWE、多模态内容生成、游戏智能体(Game Agent)等方向,能够将最新研究成果快速转化为游戏业务价值。
岗位要求:
1.计算机相关专业,具备较强的动手能力;熟悉 Python ,具备扎实的系统编程功底和优秀的复杂系统 Debug 能力;
2.训练框架经验: 深入理解模型分布式训练原理,具备 Megatron-LM、DeepSpeed 或 PyTorch FSDP 等主流框架的实际源码级开发与定制经验;
3.RL 与 RL Infra 储备: 熟悉模型训练与对齐技术(PPO、GRPO、DPO等),熟悉 Verl、ROLL,AReal 等强化学习/分布式计算框架,可以理解并解决 RL过程中的工程痛点…
招聘城市:深圳
岗位职责:
1.负责模型游戏社区、精品游戏和小游戏的相关算法研发工作;基于模型的文本、代码、多模态能力实现搜索、问答、代码开发等多场景的应用;
2.参与模型各模块算法改进,包括但不限于通过训练、精调、蒸馏、检索增强、多agent协作等技术提升模型效果;
3.关注业界的前沿模型进展,结合实际场景进行算法开发落地,实现团队技术和业务的共同发展。
岗位要求:
1.计算机或相关专业本科以上学历,具备扎实的数学、统计学以及计算机基础;
2.熟悉LLM、NLP、信息检索、多模态等领域一个或多个算法模块,在其中部分模块有丰富的落地和迭代经验;
3.有模型应用实践经验,对模型训练、精…