牛大妈在社招职位搜索混元大模型语音算法工程师北京 上海 有 10 条结果

招聘城市:深圳
…1.负责语音/音频模型研发,包括语音对话(语音交互/音视频对话)、音频理解(ASR/音频caption)、音频生成(TTS/视频配音)等模型研发;
2.负责语音/音频模型的预训练、后训练、强化学习(文本和音频强化)相关的数据和算法工作;
3.负责语音对话/音频理解/音频生成的模型开源以及产品落地(比如语音对话产品全链路端到端优化、音频理解在噪音/口音/远场/音效音乐场景的优化、语音合成在播报/闲聊/游戏/社交等场景的优化)。
岗位要求:
1.有语音对话、语音合成、语音识别、音视频多模态、语言模型(预训练、微调、强化学习)等相关经验者优先;
2.优秀的代码能力、数据结构和算法功底,熟练掌握Python或C/C++,熟悉Pytorch/Megatron/DeepSpeed等模型训练框架,有…
招聘城市:深圳
岗位职责:
1.负责语言模型在人机语音交互、音视频对话能力上的算法设计优化;
2.调研业界前沿算法,追踪最前沿的技术动态,并应用在相关的项目中;
3.参与产品讨论,基于技术对产品提出改进建议。
岗位要求:
1.有语言模型应用经验优先,包括精调(SFT)、强化(DPO,PPO)等技术的落地;
2.熟悉Pytorch,Megatron, DeepSpeed等模型训练框架;
3.熟悉自然语言处理方向常用的理论和方法,熟悉阅读理解、问答、对话、语言模型、预训练等核心技术;
4.有高质量论文发表者优先(如NeurIPs,ICLR, ICML, ACL, EMNLP, CVPR,AAAI等);
5.具有良好的数学基础,良好的英语阅读能力,具备强烈的进取心、求知欲及团队合作精神,热衷于追求技术创新;
6.具备激情,好学…
招聘城市:深圳
…方向的创新算法研究,攻克Diffusion模型加速、多模态理解模型语音模型(ASR、TTS、Omini等)、多模态理解生成统一建模加速等技术方向,包括但不限于:(Attention量化/稀疏加速、蒸馏加速、量化、投机解码、剪枝、KV Cache 压缩等等);
2.通过分析模型和任务性能瓶颈,设计创新的算法优化方案,提升多模态模型的推理效率,显著降低端到端延迟;
3.作为算法与框架团队之间的技术桥梁,聚焦于图像理解、视频生成、音频理解生成、视觉多轮交互、实时对话等任务,提升模型在推理端的性能;
4.高效协同框架开发及业务算法团队,确保技术方案落地。撰写高质量的技术文档与实验报告,并组织内部分享,推动团队整体技术认知提升。
岗位要求:
1.拥有计算机科学、人工智能、电子工程
招聘城市:深圳
…负责通用多模态模型的推理部署,包括多模态理解、生成、语音模型等研发支持,推动算法落地;
2.多模态模型性能优化及推理框架优化,提升整体吞吐、降低部署成本;提升框架易用性;
3.紧跟多模态生成和理解领域的技术前沿,推动技术创新在产品中落地;
4.针对落地业务,优化部署方案及适配定制化需求。
岗位要求:
1.了解AI基础设施、机器学习系统或高性能计算相关领域经验, 具有 vllm/sglang/TensorRT/FasterTransformer 等推理引擎实践经验;
2.精通主流多模态或全模态模型,主导或核心参与过多模态模型项目优先;有行业落地案例或相关开源项目经验者优先;
3.熟悉主流深度学习框架的网络结构与算子底层实现细节,具备模型训练…
招聘城市:深圳
岗位职责:
1.负责语音/音频模型研发,包括音频理解(ASR/音频caption)、音视频理解等模型研发;
2.负责预训练、后训练、强化学习(文本和音频强化)相关的数据、算法、评测工作;
3.负责音频理解/ASR模型开源以及产品落地(比如产品全链路端到端优化、音频理解在噪音/口音/远场/音效音乐场景的优化)。
岗位要求:
1.有语音识别、音频理解、音乐理解等相关经验者优先;
2.有音视频多模态、语言模型(预训练、微调、强化学习)等相关经验者优先;
3.优秀的代码能力、数据结构和算法功底,熟练掌握Python,熟悉Pytorch/Megatron/FSDP等模型训练框架、熟悉SLIME/VERL等RL框架优先;
4.有ACM/ICPC、NOI/IOI、Top Coder、Kaggle等比赛获奖者优先;
5.在相关顶级会议…
招聘城市:深圳
…多轮会话、语音输入/播报、文档处理等场景,完成模型能力在移动端的产品化落地;
3.负责 APP 与模型服务的接入与优化,包括流式输出、上下文管理、会话历史、Prompt 模板、模型路由、请求重试、缓存、弱网/无网处理等能力建设;
4.参与端侧模型能力探索,支持模型文件下载与管理、端侧推理接入、量化模型运行、离线能力、隐私保护、首 Token 延迟、内存与功耗优化等工作;
5.建设高质量移动端工程体系,保障 APP 在多端设备上的稳定性、兼容性、性能、安全性和用户体验;
6.与产品、算法、服务端、设计团队紧密协作,持续打磨面向 C 端用户的 AI 原生应用体验,打造好用、稳定、智能的移动端模型应用。
岗位要求:
1.本科…
招聘城市:深圳
…1.负责生图、生视频、生3D等相关创作平台的前端开发;
2.负责多模态模型在业务场景上的落地;
3.关注多模态AI前沿技术、框架,优化平台并提效。
岗位要求:
1.计算机及相关专业本科以上学历,有3年以上开发经验;
2.掌握计算机学科基础知识,包括编程、算法、数据结构、网络及web安全等;
3.前端基础扎实,深入理解前端工程化流程,熟练掌握工程构建、打包、部署等环节;
4.至少熟练掌握一种主流前端框架(如React/Vue等),逻辑思维清晰,能主动推进平台和技术优化;
5.具备良好的学习能力、沟通能力、团队协作能力,以及分析问题解决问题的能力,责任心强;
6.有多模态模型相关经验者优先,如生图…
招聘城市:深圳
岗位职责:
1.多模态驱动引擎开发,通过对文本/语音/视觉等信息,构建虚拟人表情、动作的驱动模型
2.设计多模态条件生成框架,实现语音、表情、镜头、肢体动作的联合优化;
3.开发多模态特征同步技术:语音-表情时序对齐、文本语义-镜头运动关联建模。
岗位要求:
1.熟悉掌握MLLM、RLHF、Diffusion等相关技术;
2.熟练掌握python、C++等至少一门编程语言,掌握tf、pytorch等至少一种深度学习框架;
3.优秀的分析问题和解决问题能力,对解决具有挑战性的问题充满激情;
4.逻辑思维能力好,沟通能力优秀,有好奇心,善于学习,踏实有责任心;
5.有较好的抗压能力。
招聘城市:北京
…1.跟踪业界最新的语音生成算法研究,探索下一代语音、音频生成新范式,拓展语音生成边界能力;
2.探索多模态语音模型的前沿技术,结合文本、语音、视觉等技术提升语音交互体验;
3.负责语音模型的技术研发工作,推动模型性能提升与创新应用。
岗位要求:
1.计算机科学、人工智能、电子工程、信号处理等相关专业硕士、博士研究生;
2.掌握语音模型语音合成、语音识别、音频生成、语音转换、语音Codec等一项或多项研究和开发经验;
3.熟悉主流对话模型(如GPT4o、GLM-4-Voice、Qwen2.5-Omni、Voila等),有相关项目实践经验者优先;
4.熟练掌握PyTorch等深度学习框架,有模型训练框架Megatron/Deepspeed实践经验者优先;
5.熟悉模型相关结构设计及原理…
…等方向,由算法研究、工程开发、数据处理等角色紧密协作。多位技术负责人在各自领域深耕多年,有的是学术顶会的常客,有的把模型从论文推到了千万台设备上,有的从零做出全球下载量最高的开源项目。腾讯模型已全面接入腾讯内部业务,深度融合各产品线。
公司福利: 认可价值,薪酬上不封顶
招聘摘要: 腾讯现面向社会和应届毕业生进行招聘,开展26届校招&社招活动。公司介绍:多模态团队涵盖图像、视频、3D、语音、数字人等方向,团队成员紧密协作。腾讯模型已全面接入腾讯内部业务,深度融合各产品线。多位技术负责人经验丰富,成果显著。招聘职位:算法研究员、工程开发人员…