牛大妈在社招职位搜索混元语音与音频理解方向研究员语音理解方向北京 深圳 上海 有 4 条结果

招聘城市:北京
…硕士、博士研究生;
2.掌握语音大模型、语音合成、语音识别、音频生成、语音转换、语音Codec等一项或多项研究和开发经验;
3.熟悉主流对话大模型(如GPT4o、GLM-4-Voice、Qwen2.5-Omni、Voila等),有相关项目实践经验者优先;
4.熟练掌握PyTorch等深度学习框架,有大模型训练框架Megatron/Deepspeed实践经验者优先;
5.熟悉大模型相关结构设计及原理,有大规模预训练、后训练经验者优先。
部门介绍:
腾讯AI Lab是腾讯的公司级AI实验室,于2016年4月在深圳成立。借助腾讯丰富应用场景、大数据、计算力及一流人才方面的长期积累,AI Lab立足未来,开放合作,致力于不断提升AI的认知、决策创造力,向“Make AI Everywhere”的愿景迈步…
招聘城市:深圳
方向具备深入研究或实践经验者优先:;
5.语音表征预训练(如 HuBERT, Wav2Vec, Whisper 等);
6.多模态对齐跨模态建模(音视频和文本);
7.有推动大模型在音频理解任务上达到 SOTA 性能的经验优先;
8.熟练掌握 PyTorch、TensorFlow等深度学习框架,有大规模训练分布式系统经验者优先;
9.熟练 Transformer 类模型及其在语音、多模态领域的训练和推理。
部门介绍:
腾讯AI Lab是腾讯的公司级AI实验室,于2016年4月在深圳成立。借助腾讯丰富应用场景、大数据、计算力及一流人才方面的长期积累,AI Lab立足未来,开放合作,致力于不断提升AI的认知、决策创造力,向“Make AI Everywhere”的愿景迈步。 腾讯AI Lab强调研究

腾讯 AGI模型架构研究

全职 北京
招聘城市:北京
…架构设计优化;
2.有构建或优化超大规模模型(>Billion-scale)经验,熟悉SFT、RLHF、自监督等训练范式;
3.在以下方向有深入理解或实践经验者优先:;
4.a.多模态模型(如视觉语言模型、音视频模型);
5.b.强化学习、自主智能体系统;
6.c.复杂推理规划(如 search+LLM,世界建模);
7.d.稀疏建模动态路由机制;
8.e.具备良好的工程实现能力系统性思维,能推动前沿研究在大模型系统中落地;
9.f.在顶会/顶刊(NeurIPS, ICLR, CVPR, ACL 等)发表过相关方向论文;
10.研究重点方向:;
11.多模态统一架构:原生支持视觉、语音文本的同频建模跨模态推理;
12.持续学习记忆机制:设计支持长期记忆调用任务…
招聘城市:深圳
…界工业界在图像视频生成式模型、多模态理解模型、语音模型、多模态理解生成统一建模等方向的创新算法研究,攻克Diffusion模型加速、多模态理解模型、语音模型(ASR、TTS、Omini等)、多模态理解生成统一建模加速等技术方向,包括但不限于:(Attention量化/稀疏加速、蒸馏加速、量化、投机解码、剪枝、KV Cache 压缩等等);
2.通过分析模型和任务性能瓶颈,设计创新的算法优化方案,提升多模态大模型的推理效率,显著降低端到端延迟;
3.作为算法框架团队之间的技术桥梁,聚焦于图像理解、视频生成、音频理解生成、视觉多轮交互、实时对话等任务,提升模型在推理端的性能;
4.高效协同框架开发及业务算法团队,确保技术方案落地。撰写高质量的技术文档