招聘城市:深圳
…多模态大模型结构设计,并联合业务进行模型训练效率和效果验证;
3.参与文生图、文生视频、文生3D等业务的训练性能加速;
4.参与低精度训练性能优化和业务推广、参与大窗口训练性能优化。
岗位要求:
1.熟练使用主流大模型训练框架DeepSpeed、Megatron,掌握3D并行、ZeRO机制、Flash-Attn等的原理、使用场景、优劣势以及可优化方向;
2.有ViT、SD、DiT模型训练性能优化经验者优先;
3.熟练掌握CUDA性能优化手段,有算子编写优化项目经验者优先;
4.对大模型前沿技术比较敏锐者优先;
5.有实际大模型的训练调参和效果评测项目经验的优先;
6.良好的沟通能力、解决问题能力。
岗位介绍:
在腾讯,后台开发工程师…
招聘城市:深圳
岗位职责:
1.负责语音/音频大模型研发,包括音频理解(ASR/音频caption)、音视频理解等模型研发;
2.负责预训练、后训练、强化学习(文本和音频强化)相关的数据、算法、评测工作;
3.负责音频理解/ASR模型开源以及产品落地(比如产品全链路端到端优化、音频理解在噪音/口音/远场/音效音乐场景的优化)。
岗位要求:
1.有语音识别、音频理解、音乐理解等相关经验者优先;
2.有音视频多模态、大语言模型(预训练、微调、强化学习)等相关经验者优先;
3.优秀的代码能力、数据结构和算法功底,熟练掌握Python,熟悉Pytorch/Megatron/FSDP等模型训练框架、熟悉SLIME/VERL等RL框架优先;
4.有ACM/ICPC、NOI/IOI、Top Coder、Kaggle等比赛获奖者优先;
5.在相关顶级会议…
招聘城市:深圳
…负责语音/音频大模型研发,包括语音对话(语音交互/音视频对话)、音频理解(ASR/音频caption)、音频生成(TTS/视频配音)等模型研发;
2.负责语音/音频大模型的预训练、后训练、强化学习(文本和音频强化)相关的数据和算法工作;
3.负责语音对话/音频理解/音频生成的模型开源以及产品落地(比如语音对话产品全链路端到端优化、音频理解在噪音/口音/远场/音效音乐场景的优化、语音合成在播报/闲聊/游戏/社交等场景的优化)。
岗位要求:
1.有语音对话、语音合成、语音识别、音视频多模态、大语言模型(预训练、微调、强化学习)等相关经验者优先;
2.优秀的代码能力、数据结构和算法功底,熟练掌握Python或C/C++,熟悉Pytorch/Megatron/DeepSpeed等模型训练框架,有ACM…
招聘城市:北京
…音频生成新范式,拓展语音生成边界能力;
2.探索多模态语音大模型的前沿技术,结合文本、语音、视觉等技术提升语音交互体验;
3.负责语音大模型的技术研发工作,推动模型性能提升与创新应用。
岗位要求:
1.计算机科学、人工智能、电子工程、信号处理等相关专业硕士、博士研究生;
2.掌握语音大模型、语音合成、语音识别、音频生成、语音转换、语音Codec等一项或多项研究和开发经验;
3.熟悉主流对话大模型(如GPT4o、GLM-4-Voice、Qwen2.5-Omni、Voila等),有相关项目实践经验者优先;
4.熟练掌握PyTorch等深度学习框架,有大模型训练框架Megatron/Deepspeed实践经验者优先;
5.熟悉大模型相关结构设计及原理,有大规模预训练、后训练经验者优先。
部门介绍…
招聘城市:深圳
…岗位要求:
1.计算机、电子工程、人工智能、语言学或相关领域博士,或硕士加多年相关工作经验;
2.深入理解语音音频信号处理、声学建模、语言模型和大模型架构;
3.熟练掌握 语音识别,语音翻译等 一项多多项系统开发流程,具有多语言、多任务或端到端系统经验者优先;
4.对以下方向具备深入研究或实践经验者优先:;
5.语音表征预训练(如 HuBERT, Wav2Vec, Whisper 等);
6.多模态对齐与跨模态建模(音视频和文本);
7.有推动大模型在音频理解任务上达到 SOTA 性能的经验优先;
8.熟练掌握 PyTorch、TensorFlow等深度学习框架,有大规模训练与分布式系统经验者优先;
9.熟练 Transformer 类模型及其在语音、多模态领域的训练和推理。
部门介绍:
腾讯…
招聘城市:深圳
…模态数据管线建设:设计并实现面向大模型训练与推理的多模态数据处理与构建管线,覆盖图像、视频、音频、文本、3D 及多模态理解等数据类型,支撑预训练、后训练(SFT / RLHF / Preference)及评测数据构建;
2.大规模数据工程与系统建设:构建高可靠、可扩展的数据处理系统,支持 TB / PB 级数据规模,负责批处理与流式处理任务的工程实现,参与或主导分布式并行计算(CPU / GPU 混合)的工程落地;
3.数据质量与稳定性保障:建立数据校验与质量评估机制,覆盖数据完整性、一致性、分布异常与质量回归等场景,设计并推动数据处理链路的监控与异常治理;
4.数据资产化与标准化建设:推动多模态数据结构的标准化设计,建设数据元…
招聘城市:深圳
…负责预训练数据工程体系建设,主导端到端数据工作流(Workflow) 设计、搭建与规模化落地,保障数据供给效率与稳定性;
3.负责预训练数据全生命周期管理:数据标准、质量治理、资产化管理、权限与版本管控;
4.带队攻坚数据处理关键技术与工程瓶颈,跨团队协同模型训练算法和底层架构工程、推动数据架构持续迭代。
岗位要求:
1.本科及以上,有大规模技术栈负责人/数据体系负责人经验;
2.精通大规模预训练数据 Pipeline 建设,熟悉分布式大数据处理栈(Spark/Ray/OSS 等),理解存储,网络等data infra硬件瓶颈;
3.优秀的架构设计、团队管理与跨部门推进能力,能独立负责整条数据战线;
4.熟悉大模型预训练流程和算法(文本或多模态都…