混元大模型后训练算法工程师+专家-角色扮演文本创作,最近06月26日有更新,腾讯,2027社招职位,25条信息

腾讯(tencent) 混元大模型后训练算法工程师/专家-agent

2026-06-26 全职北京

招聘城市：北京
…
1.计算机科学、人工智能或相关专业硕士及以上学历，具备大模型数据工程或模型训练实际项目经验；
2.深入理解 Transformer 架构及大语言模型训练原理，具备丰富的数据经验，能针对 LLM Alignment、RLHF等后训练场景，设计高标准数据方案，有项目实战经验；
3.深入实践过 ReAct、Reflexion 等前沿 Agent 推理框架，能够深度剖析 Agent 运行轨迹，系统性优化其思维链质量、工具调用的鲁棒性及环境反馈准确性；
4.熟练掌握 Python，熟悉 PyTorch/TensorFlow 等深度学习框架，能高效利用模型能力解决数据链路难点；
5.在CCF-A顶会（NeurIPS, ICLR, ICML, ACL 等）有高质量论文发表，或在开源社区（如 HuggingFace、GitHub大模型相关项目）有高影响力贡献者优先；
6.具备强烈的…

腾讯(tencent) 混元大模型后训练算法工程师/专家-长文&复杂指令

2026-06-26 全职北京

招聘城市：北京
…1.负责大模型后训练（SFT+RL）阶段长文与复杂指令类数据的全链路研发，围绕长篇幅内容生成、多约束/多步骤复杂指令遵循等核心场景，设计并落地覆盖数据生产、自动化质检与定向修复的端到端方案，确保数据在长程连贯性、结构完整性、指令遵循精度等维度的稳定、高标准交付；
2.深度参与Rubrics评分标准体系的设计、生产与质检，针对长文与复杂指令场景，构建原子化、可量化的多维评价体系，搭建从标准生成到评分验证的自动化 pipeline；建立多层质量校验机制，实现“评测发现问题—数据定向补强—配方迭代优化—效果闭环提升”；
3.深度追踪并研究支撑大模型后训练和复杂指令能力提升的前沿数据技术，重点关注长上下文…

腾讯(tencent) 混元大模型后训练算法工程师/专家-角色扮演&文本创作

2026-06-26 全职北京

招聘城市：北京
…的稳定、高标准交付；
2.评测驱动的数据与训练链路优化：主导面向线上核心场景的评测体系建设，设计并落地覆盖多场景的 Rubrics 评分标准与自动化评测 pipeline；以评测结果为核心抓手，系统性诊断模型在各场景下的能力短板与失败模式，驱动上游数据调优（数据增补、清洗、重采样）与训练算法及链路的针对性改进（SFT 数据配比、RL reward 信号校准、训练策略迭代等），形成"评测定位问题 → 归因分析 → 数据/算法定向优化 → 效果验证闭环"的持续迭代飞轮；
3.前沿数据技术研究与落地：深度追踪并研究支撑大模型后训练与线上场景能力提升的前沿数据技术，重点关注多轮对话数据构建、角色人设注入与一致性保持、知识…

腾讯(tencent) 混元大模型后训练算法工程师/专家-coding

2026-06-26 全职北京

招聘城市：北京
…具备大模型数据工程或Code LLM等实际项目经验；
2.深入理解 Transformer 架构及大语言模型训练原理，具备丰富的数据处理经验。能针对Code SFT、代码偏好对齐等后训练场景，设计高标准数据方案，有项目实战经验；
3.深入实践过 CodeAct、SWE-agent、LATS、AlphaCode等前沿代码推理与自动化框架者优先；
4.熟练掌握 Python，善于利用 Cursor、Claude Code 等 AI 辅助工具提升数据生产与自动化分析效率。熟悉至少一门其他主流编程语言（C++/Java/Go等），熟悉Docker优先；
5.在前沿会议有高质量论文发表，或在开源社区有高影响力贡献者优先；
6.具备强烈的数据敏感度、技术热情和自驱力，能够从繁杂的代码与报错日志中洞察模型能力的边界…

腾讯(tencent) 混元LLM大模型量化压缩高级算法工程师（北京/深圳/上海）

2026-01-28 全职深圳

招聘城市：深圳
…Cache/Attention量化算法，适配FP8/INT8/NVFP4等量化方案及不同硬件后端。探索极低bit量化训练方案，深度协同硬件联合优化，实现模型体积极致压缩和性能突破，并推动实际业务落地；
5.新技术：聚焦长上下文，多轮对话优化等压缩加速优化技术研究；
6.设计可落地的大模型压缩算法及成本优化方案，助力大模型的性能加速，不限于模型结构/软硬协同优化；
7.分析业务性能瓶颈和模型特点，定制化开发大模型压缩优化工具，实现一站式模型压缩-部署的高速推理方案；
8.参与前沿的模型压缩加速算法研究，追踪领域前沿工作，撰写并发表顶会论文。
岗位要求：
1.熟悉深度学习算法基本原理，熟练掌握PyTorch，具备扎实的Python编程能力与工程实现能力…

腾讯(tencent) TI-AI平台底座开发工程师-Golang/K8S

2026-01-15 全职西安

招聘城市：西安
…
4.结合腾讯云星脉高性能网络、向量数据库等底层技术，优化AI任务的全链路性能，降低训练与推理延迟；
5.参与AI大模型（如混元大模型）的工程化落地，提供分布式训练框架支持，解决模型部署中的性能瓶颈与资源管理问题1；
6.探索AI与云原生技术的结合，推动模型量化、动态批处理（Continuous Batching）等前沿技术的应用；
7.与算法团队、产品团队紧密协作，输出标准化API与开发者工具，提升平台易用性；
8.参与行业生态共建，推动AI平台在金融、游戏、泛娱乐等场景的规模化落地。
岗位要求：
1.精通Golang开发，熟悉C/C++、Python等语言，具备3年以上后端开发经验；
2.深入理解Kubernetes架构，有大规模集群管理经验…

腾讯(tencent) 混元大语言模型后训练算法工程师-模型合版方向（北京/深圳）

2026-04-16 全职北京

招聘城市：北京
…职责：
1.深度参与混元大模型后训练（包括 SFT、RL ）及模型合版的研发和相关算法策略研究，提升模型泛化性、能力边界和上限；
2.后训练策略和生产范式的研究，探索更加敏捷、普适和可扩展的训练范式，提升训练和生产效率；
3.相关前沿后训练技术方向探索，包括但不限于 Reasoning/Agentic 能力增强和 Scaling， RL/OPD 等收敛性和可扩展性研究；
4.将研究成果转化为实际的模型能力或生产效率，并撰写高水平技术报告或论文，提升技术影响力。
岗位要求：
1.计算机科学、数学、人工智能等相关专业硕士及以上学历，具备良好的数理基础；
2.具备良好的工程实现能力，熟练使用 PyTroch、Megatraon、vLLM 等常见大模型训练和推理框架…

腾讯(tencent) 混元大语言模型后训练算法工程师-垂域方向（北京/深圳/上海）

2026-04-27 全职北京

招聘城市：北京
…医学信息等相关专业硕士及以上学历，2年以上NLP、搜索、知识工程或智能体相关经验，有大模型落地经验者优先；
2.算法能力：深入理解 Transformer 和 LLM 训练流程，熟悉 RAG 技术栈，对检索、上下文处理、多文档理解等有较好基础；
3.Agent 能力：熟悉推理类模型、Agent 框架及其在复杂专业任务中的应用，能够将搜索、数据分析、表格处理、文档处理、报告生成等能力组合成完整工作流；
4.技术功底：熟练掌握 PyTorch 等深度学习框架，了解分布式训练、推理优化及多工具协同的工程实现；
5.综合素质：逻辑清晰，数据敏感度高，能够从复杂专业场景中抽象问题并推动落地，对专业领域 AI Agent 发展方向有自己的理解；
6.软技能：自驱力…

腾讯(tencent) 混元大语言模型后训练算法工程师-深圳/北京

2026-01-14 全职深圳

招聘城市：深圳
…1.负责大语言模型后训练（Post-Training）阶段的核心技术研发，构建和优化高质量的奖励系统（Reward System），通过Reward Modeling (RM) 和强化学习（RL）算法持续提升模型在复杂指令遵循、逻辑推理及价值观对齐方面的能力；
2.深入研究和优化 RLHF等后训练算法，提升模型训练的稳定性和最终效果；
3.负责后训练阶段的数据合成与管理，设计高效的数据飞轮机制，利用SFT、Self-Instruct等技术合成高质量训练数据，并负责建立从用户反馈（User Feedback）到模型迭代的闭环信号建模体系；
4.负责后训练模型的全维度评测与分析，制定科学的评价指标，跟进前沿技术动态，将最新研究成果快速转化为业务价值。
岗位要求：
1.计算机科学/软件工程/人工智能…

腾讯(tencent) 混元大语言模型后训练数据算法工程师（北京）

2025-12-16 全职深圳

招聘城市：深圳
岗位职责：
1.负责混元大模型高难后训练精标数据研发，包括通用Agent、知识Agent、代码Agent、复杂指令等；
2.构建后训练数据合成/挖掘体系，人机协同智能标注建设，设计数据价值验证流程，探索数据扩充路径，提升高难任务及Agent能力。
岗位要求：
1.熟练掌握Python，熟悉Linux环境开发，精通深度学习框架PyTorch；
2.具备分析问题定义问题和解决问题能力，具备持续的自驱力来面对挑战，有较强的算法实验能力；
3.持续跟进前沿的大模型技术，了解前沿的大模型相关算法，熟悉Transformer等模型结构；
4.在大模型领域顶会发表过高质量论文者优先，有LLM Agent相关经验优先。

腾讯(tencent) 混元多模态强化学习后训练算法工程师（框架协同方向）（北京/上海）

2026-03-03 全职深圳

招聘城市：深圳
…模态强化学习后训练领域的前沿进展。针对训练中出现的瓶颈（如OOD泛化不足；
4.模态融合冲突等），进行根因分析，并与框架团队协作制定解决方案；
5.跨团队支持与知识沉淀：高效协同框架开发、硬件优化及业务算法团队，确保技术方案落地。撰写高质量的技术文档、设计稿与实验报告，并组织内部分享，推动团队整体技术认知提升。
岗位要求：
1.学历与技术背景：拥有计算机科学、人工智能、电子工程、自动化等相关专业的硕士及以上学历。具备扎实的机器学习/深度学习基础，对多模态大模型和强化学习后训练技术栈有深入理解；
2.核心算法与工程能力：精通Python编程，熟练掌握PyTorch等深度学习框架。对Transformer、Diffusion等模型架构有深刻…

腾讯(tencent) 混元大模型音频理解算法工程师（北京）

2026-04-27 全职深圳

招聘城市：深圳
岗位职责：
1.负责语音/音频大模型研发，包括音频理解（ASR/音频caption）、音视频理解等模型研发；
2.负责预训练、后训练、强化学习（文本和音频强化）相关的数据、算法、评测工作；
3.负责音频理解/ASR模型开源以及产品落地（比如产品全链路端到端优化、音频理解在噪音/口音/远场/音效音乐场景的优化）。
岗位要求：
1.有语音识别、音频理解、音乐理解等相关经验者优先；
2.有音视频多模态、大语言模型（预训练、微调、强化学习）等相关经验者优先；
3.优秀的代码能力、数据结构和算法功底，熟练掌握Python，熟悉Pytorch/Megatron/FSDP等模型训练框架、熟悉SLIME/VERL等RL框架优先；
4.有ACM/ICPC、NOI/IOI、Top Coder、Kaggle等比赛获奖者优先；
5.在相关顶级会议…

腾讯(tencent) 混元大模型语音算法工程师（北京/上海）

2026-03-03 全职深圳

招聘城市：深圳
…负责语音/音频大模型研发，包括语音对话（语音交互/音视频对话）、音频理解（ASR/音频caption）、音频生成（TTS/视频配音）等模型研发；
2.负责语音/音频大模型的预训练、后训练、强化学习（文本和音频强化）相关的数据和算法工作；
3.负责语音对话/音频理解/音频生成的模型开源以及产品落地（比如语音对话产品全链路端到端优化、音频理解在噪音/口音/远场/音效音乐场景的优化、语音合成在播报/闲聊/游戏/社交等场景的优化）。
岗位要求：
1.有语音对话、语音合成、语音识别、音视频多模态、大语言模型（预训练、微调、强化学习）等相关经验者优先；
2.优秀的代码能力、数据结构和算法功底，熟练掌握Python或C/C++，熟悉Pytorch/Megatron/DeepSpeed等模型训练框架，有ACM…

腾讯(tencent) 混元多模态大模型强化学习后训练框架研发工程师（北京）

2026-03-03 全职深圳

招聘城市：深圳
岗位职责：
1.负责混元多模态大模型的RL后训练框架研发；
2.设计和开发高效的框架和算子，以支持各种硬件加速器；
3.参与强化学习算法的优化和实现，提高训练和推理性能；
4.跨团队协作，与算法、软件、硬件团队密切合作，提高框架性能和稳定性。
岗位要求：
1.熟悉常用的大模型训练推理框架，如PyTorch/Megatron/VLLM/Verl，有相关开发经验；
2.熟悉Docker、Kubernetes等容器和容器编排技术；
3.熟悉编译器相关技术，了解MLIR/XLA/TVM等AI编译器者优先考虑；
4.熟悉CPU/GPU硬件架构，有扎实的CUDA/OpenMP编程基础；
5.良好的团队协作能力和沟通能力，具有较强的自我驱动能力。

腾讯(tencent) 混元大模型评测平台高级工程师（北京/深圳）

2026-03-05 全职深圳

招聘城市：深圳
…
3.构建自动化评测流水线，提升评测效率与研发迭代速度；
4.与算法、产品团队紧密协作，理解评测需求并转化为可落地的技术方案。
岗位要求：
1.本科及以上学历，计算机相关专业，5 年以上后端开发经验；
2.扎实的系统设计能力，有复杂业务系统或平台型产品的架构经验；
3.熟练掌握 Python/Go 等至少一门语言，熟悉常用框架与中间件；
4.熟悉分布式系统、任务调度、消息队列等技术，有高并发系统开发经验；
5.良好的沟通与协作能力，能够推动跨团队合作。
加分项：
1.有 MLOps/LLMOps 平台建设经验，熟悉模型训练、推理、评估等流程；
2.熟悉大模型评测方法论，了解主流 Benchmark 与评估框架；
3.对 AI Infra 领域有热情，关注行业前沿…

腾讯(tencent) 混元多模态数据工程师（北京）

2026-02-07 全职深圳

招聘城市：深圳
…数据管线建设：设计并实现面向大模型训练与推理的多模态数据处理与构建管线，覆盖图像、视频、音频、文本、3D 及多模态理解等数据类型，支撑预训练、后训练（SFT / RLHF / Preference）及评测数据构建；
2.大规模数据工程与系统建设：构建高可靠、可扩展的数据处理系统，支持 TB / PB 级数据规模，负责批处理与流式处理任务的工程实现，参与或主导分布式并行计算（CPU / GPU 混合）的工程落地；
3.数据质量与稳定性保障：建立数据校验与质量评估机制，覆盖数据完整性、一致性、分布异常与质量回归等场景，设计并推动数据处理链路的监控与异常治理；
4.数据资产化与标准化建设：推动多模态数据结构的标准化设计，建设数据元信息…

腾讯(tencent) 混元Agent数据与环境平台工程师（深圳/北京/上海）

2026-06-02 全职北京

招聘城市：北京
…工程能力与系统设计能力，能在复杂系统中推进架构落地；
2.熟练掌握 Docker 容器化交付体系，理解镜像构建优化、依赖隔离、网络/存储、制品/镜像仓库等能力，并能设计可复现的环境交付流程；
3.熟悉 Kubernetes 使用与排障，能在集群环境下完成部署治理、资源配置和稳定性问题定位；
4.有后端服务、数据平台、任务平台、机器学习平台或评测平台相关研发经验；
5.理解数据集管理中的版本、元信息、质量校验、权限、可追踪性和自动化流程，具备良好的数据建模能力；
6.具备强问题分析与闭环能力，能高效利用 AI 工具提升研发效率，并能与算法和平台团队协作推进落地。
加分项：
1.熟悉强化学习、Eval、Benchmark、Agent 任务数据或大模型训练…

腾讯(tencent) 混元AI应用研发工程师（深圳/北京）

2025-11-11 全职北京

招聘城市：北京
岗位职责：
1.负责TTS、ASR、声学前处理、自然语言处理、多模态大模型等AI系统的工程开发（包括训练工具和推理引擎的开发、优化、交付等）；
2.负责AI系统最新算法的集成、工程化、实际场景效果验证、优化、上线；
3.负责AI相关业务、产品的工程支持，在效果和性能上更好的落地。
岗位要求：
1.本科及以上学历，计算机相关专业，本科毕业后有5年以上工作+学习的经验；
2.全面的计算机体系相关知识、基础扎实，有较好的数据结构基&算法基础，具备良好的思维逻辑；
3.精通c/c++/python语言，熟悉golang语言更佳；
4.优秀的分析与解决问题的能力，良好的沟通与团队合作能力；
5.具备一定的分布式系统、微服务架构、数据库…

腾讯混元3D场景生成与交互大模型研究员（北京/上海）

2026-02-26 全职深圳

招聘城市：深圳
…领域的应用；
2.结合3D/2D生成技术，研发新一代世界模型，实现实时交互、精准可控、符合物理规律的世界交互。
岗位要求：
1.计算机、人工智能、数学等相关专业硕士及以上学历，有AIGC方向顶级论文者优先；
2.满足以下任意一种技术栈要求：
1）生成式模型：深入理解DiT、self- forcing等模型原理，有3D生成、图像生成或者可控视频生成经验，对世界模型有深入理解；
2）三维重建：熟悉Gaussian Splatting、3R、VGGT、MVS、SLAM等方法，对3D重建任务有深入理解；
3）后训练及加速技术：深入理解RL算法或者DMD等模型蒸馏算法，有3D、图像、视频等生成模型后训练经验或者蒸馏加速经验；
3.代码能力强，能快速实现idea, 有扎实工程能力；数理功底扎实…

腾讯混元AIGC算法研究员（文生3D）（深圳/北京/上海）

2026-01-10 全职深圳

招聘城市：深圳
岗位职责：
1.研发新一代3D资产生成大模型，突破生成质量、速度与可控性的技术边界；
2.构建工业级3D AI生成管线，解决几何拓扑优化、材质贴图生成、物理合理性等核心问题。
岗位要求：
1.计算机、人工智能、数学等相关专业硕士及以上学历，有AIGC方向顶级论文者优先；
2.满足以下任意一种技术栈要求：
1）.3D表达技术：熟悉几何处理管线（Mesh操作/UV映射等），熟悉NeRF、SDF、Gaussian Splatting等表示方法；
2）.生成式模型：深入理解Diffusion类模型、或自回归AR类模型原理，有3D生成经验者优先；
3）.后训练技术：对post-training、强化学习、多模态理解与生成有丰富经验；
4）.纹理材质技术：了解3D贴图、3D材质生成等技术；
3…

牛大妈在社招职位搜索混元大模型后训练算法工程师+专家-角色扮演文本创作 有 25 条结果

牛大妈在社招职位搜索混元大模型后训练算法工程师+专家-角色扮演文本创作有 25 条结果