混元大语言模型后训练数据算法工程师北京,最近06月26日有更新,腾讯,2027社招职位,15条信息

腾讯(tencent) 混元大语言模型后训练数据算法工程师（北京）

2025-12-16 全职深圳

招聘城市：深圳
岗位职责：
1.负责混元大模型高难后训练精标数据研发，包括通用Agent、知识Agent、代码Agent、复杂指令等；
2.构建后训练数据合成/挖掘体系，人机协同智能标注建设，设计数据价值验证流程，探索数据扩充路径，提升高难任务及Agent能力。
岗位要求：
1.熟练掌握Python，熟悉Linux环境开发，精通深度学习框架PyTorch；
2.具备分析问题定义问题和解决问题能力，具备持续的自驱力来面对挑战，有较强的算法实验能力；
3.持续跟进前沿的大模型技术，了解前沿的大模型相关算法，熟悉Transformer等模型结构；
4.在大模型领域顶会发表过高质量论文者优先，有LLM Agent相关经验优先。

腾讯(tencent) 混元大语言模型后训练算法工程师-深圳/北京

2026-01-14 全职深圳

招聘城市：深圳
…1.负责大语言模型后训练（Post-Training）阶段的核心技术研发，构建和优化高质量的奖励系统（Reward System），通过Reward Modeling (RM) 和强化学习（RL）算法持续提升模型在复杂指令遵循、逻辑推理及价值观对齐方面的能力；
2.深入研究和优化 RLHF等后训练算法，提升模型训练的稳定性和最终效果；
3.负责后训练阶段的数据合成与管理，设计高效的数据飞轮机制，利用SFT、Self-Instruct等技术合成高质量训练数据，并负责建立从用户反馈（User Feedback）到模型迭代的闭环信号建模体系；
4.负责后训练模型的全维度评测与分析，制定科学的评价指标，跟进前沿技术动态，将最新研究成果快速转化为业务价值。
岗位要求：
1.计算机科学/软件工程/人工智能…

腾讯(tencent) 混元大语言模型后训练算法工程师-模型合版方向（北京/深圳）

2026-04-16 全职北京

招聘城市：北京
…职责：
1.深度参与混元大模型后训练（包括 SFT、RL ）及模型合版的研发和相关算法策略研究，提升模型泛化性、能力边界和上限；
2.后训练策略和生产范式的研究，探索更加敏捷、普适和可扩展的训练范式，提升训练和生产效率；
3.相关前沿后训练技术方向探索，包括但不限于 Reasoning/Agentic 能力增强和 Scaling， RL/OPD 等收敛性和可扩展性研究；
4.将研究成果转化为实际的模型能力或生产效率，并撰写高水平技术报告或论文，提升技术影响力。
岗位要求：
1.计算机科学、数学、人工智能等相关专业硕士及以上学历，具备良好的数理基础；
2.具备良好的工程实现能力，熟练使用 PyTroch、Megatraon、vLLM 等常见大模型训练和推理框架…

腾讯(tencent) 混元大语言模型后训练算法工程师-垂域方向（北京/深圳/上海）

2026-04-27 全职北京

招聘城市：北京
…确保生成结果的真实性、严谨性与可追溯性；
4.前沿技术转化：探索推理类模型在专业领域 Agent 的落地，包括基于过程监督的思维链（CoT）优化、面向专业任务反馈的强化学习（RL）策略，以及搜索、数据分析、文件处理等多工具协同能力的持续演进。
岗位要求：
1.背景要求：计算机、数学、统计学、法学、金融、医学信息等相关专业硕士及以上学历，2年以上NLP、搜索、知识工程或智能体相关经验，有大模型落地经验者优先；
2.算法能力：深入理解 Transformer 和 LLM 训练流程，熟悉 RAG 技术栈，对检索、上下文处理、多文档理解等有较好基础；
3.Agent 能力：熟悉推理类模型、Agent 框架及其在复杂专业任务中的应用，能够将搜索、数据分析、表格处理、文档处理…

腾讯(tencent) 混元大模型后训练算法工程师/专家-agent

2026-06-26 全职北京

招聘城市：北京
…将最新数据相关成果快速转化为业务价值。
岗位要求：
1.计算机科学、人工智能或相关专业硕士及以上学历，具备大模型数据工程或模型训练实际项目经验；
2.深入理解 Transformer 架构及大语言模型训练原理，具备丰富的数据经验，能针对 LLM Alignment、RLHF等后训练场景，设计高标准数据方案，有项目实战经验；
3.深入实践过 ReAct、Reflexion 等前沿 Agent 推理框架，能够深度剖析 Agent 运行轨迹，系统性优化其思维链质量、工具调用的鲁棒性及环境反馈准确性；
4.熟练掌握 Python，熟悉 PyTorch/TensorFlow 等深度学习框架，能高效利用模型能力解决数据链路难点；
5.在CCF-A顶会（NeurIPS, ICLR, ICML, ACL 等）有高质量论文发表，或在开源社区（如 HuggingFace、GitHub大模型相关…

腾讯(tencent) 混元大模型后训练算法工程师/专家-coding

2026-06-26 全职北京

招聘城市：北京
…代码自验证生成、AI SWE等方向，能够将最新代码数据相关的研究成果快速转化为业务价值。
岗位要求：
1.计算机科学、软件工程、人工智能或相关专业硕士及以上学历，具备大模型数据工程或Code LLM等实际项目经验；
2.深入理解 Transformer 架构及大语言模型训练原理，具备丰富的数据处理经验。能针对Code SFT、代码偏好对齐等后训练场景，设计高标准数据方案，有项目实战经验；
3.深入实践过 CodeAct、SWE-agent、LATS、AlphaCode等前沿代码推理与自动化框架者优先；
4.熟练掌握 Python，善于利用 Cursor、Claude Code 等 AI 辅助工具提升数据生产与自动化分析效率。熟悉至少一门其他主流编程语言（C++/Java/Go等），熟悉Docker优先；
5.在前沿会议有高质量论文…

腾讯(tencent) 混元大模型语音算法工程师（北京/上海）

2026-03-03 全职深圳

招聘城市：深圳
…负责语音/音频大模型研发，包括语音对话（语音交互/音视频对话）、音频理解（ASR/音频caption）、音频生成（TTS/视频配音）等模型研发；
2.负责语音/音频大模型的预训练、后训练、强化学习（文本和音频强化）相关的数据和算法工作；
3.负责语音对话/音频理解/音频生成的模型开源以及产品落地（比如语音对话产品全链路端到端优化、音频理解在噪音/口音/远场/音效音乐场景的优化、语音合成在播报/闲聊/游戏/社交等场景的优化）。
岗位要求：
1.有语音对话、语音合成、语音识别、音视频多模态、大语言模型（预训练、微调、强化学习）等相关经验者优先；
2.优秀的代码能力、数据结构和算法功底，熟练掌握Python或C/C++，熟悉Pytorch/Megatron/DeepSpeed等模型训练框架，有ACM…

腾讯(tencent) 混元大模型音频理解算法工程师（北京）

2026-04-27 全职深圳

招聘城市：深圳
岗位职责：
1.负责语音/音频大模型研发，包括音频理解（ASR/音频caption）、音视频理解等模型研发；
2.负责预训练、后训练、强化学习（文本和音频强化）相关的数据、算法、评测工作；
3.负责音频理解/ASR模型开源以及产品落地（比如产品全链路端到端优化、音频理解在噪音/口音/远场/音效音乐场景的优化）。
岗位要求：
1.有语音识别、音频理解、音乐理解等相关经验者优先；
2.有音视频多模态、大语言模型（预训练、微调、强化学习）等相关经验者优先；
3.优秀的代码能力、数据结构和算法功底，熟练掌握Python，熟悉Pytorch/Megatron/FSDP等模型训练框架、熟悉SLIME/VERL等RL框架优先；
4.有ACM/ICPC、NOI/IOI、Top Coder、Kaggle等比赛获奖者优先；
5.在相关顶级会议…

腾讯(tencent) 混元Agent数据与环境平台工程师（深圳/北京/上海）

2026-06-02 全职北京

招聘城市：北京
…化交付体系，理解镜像构建优化、依赖隔离、网络/存储、制品/镜像仓库等能力，并能设计可复现的环境交付流程；
3.熟悉 Kubernetes 使用与排障，能在集群环境下完成部署治理、资源配置和稳定性问题定位；
4.有后端服务、数据平台、任务平台、机器学习平台或评测平台相关研发经验；
5.理解数据集管理中的版本、元信息、质量校验、权限、可追踪性和自动化流程，具备良好的数据建模能力；
6.具备强问题分析与闭环能力，能高效利用 AI 工具提升研发效率，并能与算法和平台团队协作推进落地。
加分项：
1.熟悉强化学习、Eval、Benchmark、Agent 任务数据或大模型训练数据流程；
2.具备跨语言协作能力，能借助 AI 工具阅读和维护 TypeScript / Rust / Go 代码。

腾讯(tencent) 混元大模型评测平台高级工程师（北京/深圳）

2026-03-05 全职深圳

招聘城市：深圳
…数据管理、结果分析等核心系统，保障平台稳定性与可扩展性；
3.构建自动化评测流水线，提升评测效率与研发迭代速度；
4.与算法、产品团队紧密协作，理解评测需求并转化为可落地的技术方案。
岗位要求：
1.本科及以上学历，计算机相关专业，5 年以上后端开发经验；
2.扎实的系统设计能力，有复杂业务系统或平台型产品的架构经验；
3.熟练掌握 Python/Go 等至少一门语言，熟悉常用框架与中间件；
4.熟悉分布式系统、任务调度、消息队列等技术，有高并发系统开发经验；
5.良好的沟通与协作能力，能够推动跨团队合作。
加分项：
1.有 MLOps/LLMOps 平台建设经验，熟悉模型训练、推理、评估等流程；
2.熟悉大模型评测方法论，了解…

腾讯混元语音与音频理解方向研究员（语音生成方向）（北京/深圳/上海）

2025-10-09 全职北京

招聘城市：北京
…3.熟悉主流对话大模型（如GPT4o、GLM-4-Voice、Qwen2.5-Omni、Voila等），有相关项目实践经验者优先；
4.熟练掌握PyTorch等深度学习框架，有大模型训练框架Megatron/Deepspeed实践经验者优先；
5.熟悉大模型相关结构设计及原理，有大规模预训练、后训练经验者优先。
部门介绍：
腾讯AI Lab是腾讯的公司级AI实验室，于2016年4月在深圳成立。借助腾讯丰富应用场景、大数据、计算力及一流人才方面的长期积累，AI Lab立足未来，开放合作，致力于不断提升AI的认知、决策与创造力，向“Make AI Everywhere”的愿景迈步。腾讯AI Lab强调研究与应用并重发展，基础研究关注机器学习、计算机视觉、语音技术及自然语言处理等四大方向，780…

腾讯(tencent) TI-AI平台底座开发工程师-Golang/K8S

2026-01-15 全职西安

招聘城市：西安
…
4.结合腾讯云星脉高性能网络、向量数据库等底层技术，优化AI任务的全链路性能，降低训练与推理延迟；
5.参与AI大模型（如混元大模型）的工程化落地，提供分布式训练框架支持，解决模型部署中的性能瓶颈与资源管理问题1；
6.探索AI与云原生技术的结合，推动模型量化、动态批处理（Continuous Batching）等前沿技术的应用；
7.与算法团队、产品团队紧密协作，输出标准化API与开发者工具，提升平台易用性；
8.参与行业生态共建，推动AI平台在金融、游戏、泛娱乐等场景的规模化落地。
岗位要求：
1.精通Golang开发，熟悉C/C++、Python等语言，具备3年以上后端开发经验；
2.深入理解Kubernetes架构，有大规模集群管理经验…

腾讯(tencent) 混元AI应用研发工程师（深圳/北京）

2025-11-11 全职北京

招聘城市：北京
…ASR、声学前处理、自然语言处理、多模态大模型等AI系统的工程开发（包括训练工具和推理引擎的开发、优化、交付等）；
2.负责AI系统最新算法的集成、工程化、实际场景效果验证、优化、上线；
3.负责AI相关业务、产品的工程支持，在效果和性能上更好的落地。
岗位要求：
1.本科及以上学历，计算机相关专业，本科毕业后有5年以上工作+学习的经验；
2.全面的计算机体系相关知识、基础扎实，有较好的数据结构基&算法基础，具备良好的思维逻辑；
3.精通c/c++/python语言，熟悉golang语言更佳；
4.优秀的分析与解决问题的能力，良好的沟通与团队合作能力；
5.具备一定的分布式系统、微服务架构、数据库技术、缓存技术、消息队列…

腾讯(tencent) 混元大模型平台研发工程师（北京/深圳）

2026-06-26 全职北京

招聘城市：北京
…混元平台核心架构设计与迭代开发，聚焦大模型训练、推理、评估、数据多个核心场景，解决大规模训练、数据处理、评测等场景问题，持续提升大模型训练稳定性与平台整体性能上限；
2.LLMOps工程体系迭代与研发效能升级：持续深耕并跟进业界AIGC、大模型工程化前沿技术与落地实践，结合内部模型预训练、后训练、迭代、部署全流程诉求，持续优化平台技术方案与产品形态。聚焦平台易用性、自动化、标准化建设，降低大模型研发与落地门槛，持续完善、升级、落地全链路LLMOps研发体系。
岗位要求：
1.本科及以上学历，具备扎实的AI工程化、大模型研发底座技术功底，熟练掌握 PyTorch/TensorFlow/DeepSpeed 等主流深度学习框架，拥有真实落地的模型训练优化、分布式训练、模型…

腾讯(tencent) 混元大模型算法研究员-大模型搜索方向（北京/深圳）

2025-11-27 全职深圳

招聘城市：深圳
…负责大语言模型在AI原生搜索引擎上的优化和落地；
2.建设AI原生搜索系统，包括大模型在内容理解、召回、排序、时效性、权威性、query分析等模块的应用落地；
3.调研业界前沿算法，包括大模型引用预估、搜索领域后训练、LLM for ranking&retrieval，Listwise/setwise ranking等前沿技术在搜索引擎理的研究和应用；
4.参与产品讨论，基于技术对产品提出改进建议。
岗位要求：
1.有大语言模型应用经验优先，包括精调(SFT)、强化(GRPO)等技术的落地；
2.有RAG或LLM Agent的应用落地经验者优先；
3.熟悉搜索系统模块，有内容理解、召回、排序、时效性、权威性、query分析等落地经验优先；
4.熟悉TensorFlow，Keras，Pytorch等常规深度学习框架；
5.熟悉自然语言处理方向…

牛大妈在社招职位搜索混元大语言模型后训练数据算法工程师北京 有 15 条结果

牛大妈在社招职位搜索混元大语言模型后训练数据算法工程师北京有 15 条结果