混元大模型语音算法工程师北京上海,05月20日发布,腾讯,2027社招职位,10条信息

腾讯(tencent) 混元大模型语音算法工程师（北京/上海）

2026-03-03 全职深圳

招聘城市：深圳
…1.负责语音/音频大模型研发，包括语音对话（语音交互/音视频对话）、音频理解（ASR/音频caption）、音频生成（TTS/视频配音）等模型研发；
2.负责语音/音频大模型的预训练、后训练、强化学习（文本和音频强化）相关的数据和算法工作；
3.负责语音对话/音频理解/音频生成的模型开源以及产品落地（比如语音对话产品全链路端到端优化、音频理解在噪音/口音/远场/音效音乐场景的优化、语音合成在播报/闲聊/游戏/社交等场景的优化）。
岗位要求：
1.有语音对话、语音合成、语音识别、音视频多模态、大语言模型（预训练、微调、强化学习）等相关经验者优先；
2.优秀的代码能力、数据结构和算法功底，熟练掌握Python或C/C++，熟悉Pytorch/Megatron/DeepSpeed等模型训练框架，有…

腾讯(tencent) 混元大模型交互算法工程师（北京/上海）

2025-12-15 全职深圳

招聘城市：深圳
岗位职责：
1.负责大语言模型在人机语音交互、音视频对话能力上的算法设计优化；
2.调研业界前沿算法，追踪最前沿的技术动态，并应用在相关的项目中；
3.参与产品讨论，基于技术对产品提出改进建议。
岗位要求：
1.有大语言模型应用经验优先，包括精调(SFT)、强化(DPO,PPO)等技术的落地；
2.熟悉Pytorch，Megatron, DeepSpeed等模型训练框架；
3.熟悉自然语言处理方向常用的理论和方法，熟悉阅读理解、问答、对话、语言模型、预训练等核心技术；
4.有高质量论文发表者优先（如NeurIPs，ICLR, ICML, ACL, EMNLP, CVPR，AAAI等）；
5.具有良好的数学基础，良好的英语阅读能力,具备强烈的进取心、求知欲及团队合作精神，热衷于追求技术创新；
6.具备激情，好学…

腾讯(tencent) 混元多模态大模型算法加速工程师（深圳/北京/上海/杭州）

2026-04-07 全职深圳

招聘城市：深圳
…方向的创新算法研究，攻克Diffusion模型加速、多模态理解模型、语音模型（ASR、TTS、Omini等）、多模态理解生成统一建模加速等技术方向，包括但不限于：（Attention量化/稀疏加速、蒸馏加速、量化、投机解码、剪枝、KV Cache 压缩等等）；
2.通过分析模型和任务性能瓶颈，设计创新的算法优化方案，提升多模态大模型的推理效率，显著降低端到端延迟；
3.作为算法与框架团队之间的技术桥梁，聚焦于图像理解、视频生成、音频理解生成、视觉多轮交互、实时对话等任务，提升模型在推理端的性能；
4.高效协同框架开发及业务算法团队，确保技术方案落地。撰写高质量的技术文档与实验报告，并组织内部分享，推动团队整体技术认知提升。
岗位要求：
1.拥有计算机科学、人工智能、电子工程…

腾讯(tencent) 混元多模态大模型推理加速工程师（深圳/北京/上海/杭州）

2026-02-28 全职深圳

招聘城市：深圳
…负责通用多模态大模型的推理部署，包括多模态理解、生成、语音大模型等研发支持，推动算法落地；
2.多模态大模型性能优化及推理框架优化，提升整体吞吐、降低部署成本；提升框架易用性；
3.紧跟多模态生成和理解领域的技术前沿，推动技术创新在产品中落地；
4.针对落地业务，优化部署方案及适配定制化需求。
岗位要求：
1.了解AI基础设施、机器学习系统或高性能计算相关领域经验，具有 vllm/sglang/TensorRT/FasterTransformer 等推理引擎实践经验；
2.精通主流多模态或全模态大模型，主导或核心参与过多模态大模型项目优先；有行业落地案例或相关开源项目经验者优先；
3.熟悉主流深度学习框架的网络结构与算子底层实现细节，具备模型训练…

腾讯(tencent) 混元大模型音频理解算法工程师（北京）

2026-04-27 全职深圳

招聘城市：深圳
岗位职责：
1.负责语音/音频大模型研发，包括音频理解（ASR/音频caption）、音视频理解等模型研发；
2.负责预训练、后训练、强化学习（文本和音频强化）相关的数据、算法、评测工作；
3.负责音频理解/ASR模型开源以及产品落地（比如产品全链路端到端优化、音频理解在噪音/口音/远场/音效音乐场景的优化）。
岗位要求：
1.有语音识别、音频理解、音乐理解等相关经验者优先；
2.有音视频多模态、大语言模型（预训练、微调、强化学习）等相关经验者优先；
3.优秀的代码能力、数据结构和算法功底，熟练掌握Python，熟悉Pytorch/Megatron/FSDP等模型训练框架、熟悉SLIME/VERL等RL框架优先；
4.有ACM/ICPC、NOI/IOI、Top Coder、Kaggle等比赛获奖者优先；
5.在相关顶级会议…

腾讯(tencent) 混元-移动端大模型应用开发工程师（北京/深圳）

2026-05-11 全职深圳

招聘城市：深圳
…多轮会话、语音输入/播报、文档处理等场景，完成大模型能力在移动端的产品化落地；
3.负责 APP 与大模型服务的接入与优化，包括流式输出、上下文管理、会话历史、Prompt 模板、模型路由、请求重试、缓存、弱网/无网处理等能力建设；
4.参与端侧大模型能力探索，支持模型文件下载与管理、端侧推理接入、量化模型运行、离线能力、隐私保护、首 Token 延迟、内存与功耗优化等工作；
5.建设高质量移动端工程体系，保障 APP 在多端设备上的稳定性、兼容性、性能、安全性和用户体验；
6.与产品、算法、服务端、设计团队紧密协作，持续打磨面向 C 端用户的 AI 原生应用体验，打造好用、稳定、智能的移动端大模型应用。
岗位要求：
1.本科…

腾讯(tencent) 混元多模态前端开发工程师（北京）

2026-01-30 全职深圳

招聘城市：深圳
…1.负责混元生图、生视频、生3D等相关创作平台的前端开发；
2.负责多模态大模型在业务场景上的落地；
3.关注多模态AI前沿技术、框架，优化平台并提效。
岗位要求：
1.计算机及相关专业本科以上学历，有3年以上开发经验；
2.掌握计算机学科基础知识，包括编程、算法、数据结构、网络及web安全等；
3.前端基础扎实，深入理解前端工程化流程，熟练掌握工程构建、打包、部署等环节；
4.至少熟练掌握一种主流前端框架（如React/Vue等），逻辑思维清晰，能主动推进平台和技术优化；
5.具备良好的学习能力、沟通能力、团队协作能力，以及分析问题解决问题的能力，责任心强；
6.有多模态大模型相关经验者优先，如生图…

腾讯混元多模态算法应用工程师

2025-10-13 全职深圳

招聘城市：深圳
岗位职责：
1.多模态驱动引擎开发,通过对文本/语音/视觉等信息，构建虚拟人表情、动作的驱动大模型；
2.设计多模态条件生成框架，实现语音、表情、镜头、肢体动作的联合优化；
3.开发多模态特征同步技术：语音-表情时序对齐、文本语义-镜头运动关联建模。
岗位要求：
1.熟悉掌握MLLM、RLHF、Diffusion等相关技术；
2.熟练掌握python、C++等至少一门编程语言，掌握tf、pytorch等至少一种深度学习框架；
3.优秀的分析问题和解决问题能力，对解决具有挑战性的问题充满激情；
4.逻辑思维能力好，沟通能力优秀，有好奇心，善于学习，踏实有责任心；
5.有较好的抗压能力。

腾讯混元语音与音频理解方向研究员（语音生成方向）（北京/深圳/上海）

2025-10-09 全职北京

招聘城市：北京
…1.跟踪业界最新的语音生成算法研究，探索下一代语音、音频生成新范式，拓展语音生成边界能力；
2.探索多模态语音大模型的前沿技术，结合文本、语音、视觉等技术提升语音交互体验；
3.负责语音大模型的技术研发工作，推动模型性能提升与创新应用。
岗位要求：
1.计算机科学、人工智能、电子工程、信号处理等相关专业硕士、博士研究生；
2.掌握语音大模型、语音合成、语音识别、音频生成、语音转换、语音Codec等一项或多项研究和开发经验；
3.熟悉主流对话大模型（如GPT4o、GLM-4-Voice、Qwen2.5-Omni、Voila等），有相关项目实践经验者优先；
4.熟练掌握PyTorch等深度学习框架，有大模型训练框架Megatron/Deepspeed实践经验者优先；
5.熟悉大模型相关结构设计及原理…

腾讯腾讯混元多模态顶尖团队，热招顶尖人才

2026-05-20 全职

…等方向，由算法研究、工程开发、数据处理等角色紧密协作。多位技术负责人在各自领域深耕多年，有的是学术顶会的常客，有的把模型从论文推到了千万台设备上，有的从零做出全球下载量最高的开源项目。腾讯混元大模型已全面接入腾讯内部业务，深度融合各产品线。
公司福利: 认可价值，薪酬上不封顶
招聘摘要: 腾讯现面向社会和应届毕业生进行招聘，开展26届校招&社招活动。公司介绍：混元多模态团队涵盖图像、视频、3D、语音、数字人等方向，团队成员紧密协作。腾讯混元大模型已全面接入腾讯内部业务，深度融合各产品线。多位技术负责人经验丰富，成果显著。招聘职位：算法研究员、工程开发人员…

牛大妈在社招职位搜索混元大模型语音算法工程师北京 上海 有 10 条结果

牛大妈在社招职位搜索混元大模型语音算法工程师北京上海有 10 条结果