牛大妈在社招职位搜索混元大语言模型后训练数据算法工程师北京 有 15 条结果

招聘城市:深圳
岗位职责:
1.负责模型高难训练精标数据研发,包括通用Agent、知识Agent、代码Agent、复杂指令等;
2.构建训练数据合成/挖掘体系,人机协同智能标注建设,设计数据价值验证流程,探索数据扩充路径,提升高难任务及Agent能力。
岗位要求:
1.熟练掌握Python,熟悉Linux环境开发,精通深度学习框架PyTorch;
2.具备分析问题定义问题和解决问题能力,具备持续的自驱力来面对挑战,有较强的算法实验能力;
3.持续跟进前沿的模型技术,了解前沿的模型相关算法,熟悉Transformer等模型结构;
4.在模型领域顶会发表过高质量论文者优先,有LLM Agent相关经验优先。
招聘城市:深圳
…1.负责语言模型训练(Post-Training)阶段的核心技术研发,构建和优化高质量的奖励系统(Reward System),通过Reward Modeling (RM) 和强化学习(RL)算法持续提升模型在复杂指令遵循、逻辑推理及价值观对齐方面的能力;
2.深入研究和优化 RLHF等训练算法,提升模型训练的稳定性和最终效果;
3.负责训练阶段的数据合成与管理,设计高效的数据飞轮机制,利用SFT、Self-Instruct等技术合成高质量训练数据,并负责建立从用户反馈(User Feedback)到模型迭代的闭环信号建模体系;
4.负责训练模型的全维度评测与分析,制定科学的评价指标,跟进前沿技术动态,将最新研究成果快速转化为业务价值。
岗位要求:
1.计算机科学/软件工程/人工智能…
招聘城市:北京
…职责:
1.深度参与模型训练(包括 SFT、RL )及模型合版的研发和相关算法策略研究,提升模型泛化性、能力边界和上限;
2.训练策略和生产范式的研究,探索更加敏捷、普适和可扩展的训练范式,提升训练和生产效率;
3.相关前沿训练技术方向探索,包括但不限于 Reasoning/Agentic 能力增强和 Scaling, RL/OPD 等收敛性和可扩展性研究;
4.将研究成果转化为实际的模型能力或生产效率,并撰写高水平技术报告或论文,提升技术影响力。
岗位要求:
1.计算机科学、数学、人工智能等相关专业硕士及以上学历,具备良好的数理基础;
2.具备良好的工程实现能力,熟练使用 PyTroch、Megatraon、vLLM 等常见模型训练和推理框架…
招聘城市:北京
…确保生成结果的真实性、严谨性与可追溯性;
4.前沿技术转化:探索推理类模型在专业领域 Agent 的落地,包括基于过程监督的思维链(CoT)优化、面向专业任务反馈的强化学习(RL)策略,以及搜索、数据分析、文件处理等多工具协同能力的持续演进。
岗位要求:
1.背景要求:计算机、数学、统计学、法学、金融、医学信息等相关专业硕士及以上学历,2年以上NLP、搜索、知识工程或智能体相关经验,有模型落地经验者优先;
2.算法能力:深入理解 Transformer 和 LLM 训练流程,熟悉 RAG 技术栈,对检索、上下文处理、多文档理解等有较好基础;
3.Agent 能力:熟悉推理类模型、Agent 框架及其在复杂专业任务中的应用,能够将搜索、数据分析、表格处理、文档处理…
招聘城市:北京
…将最新数据相关成果快速转化为业务价值。
岗位要求:
1.计算机科学、人工智能或相关专业硕士及以上学历,具备模型数据工程模型训练实际项目经验;
2.深入理解 Transformer 架构及语言模型训练原理,具备丰富的数据经验,能针对 LLM Alignment、RLHF等训练场景,设计高标准数据方案,有项目实战经验;
3.深入实践过 ReAct、Reflexion 等前沿 Agent 推理框架,能够深度剖析 Agent 运行轨迹,系统性优化其思维链质量、工具调用的鲁棒性及环境反馈准确性;
4.熟练掌握 Python,熟悉 PyTorch/TensorFlow 等深度学习框架,能高效利用模型能力解决数据链路难点;
5.在CCF-A顶会(NeurIPS, ICLR, ICML, ACL 等)有高质量论文发表,或在开源社区(如 HuggingFace、GitHub模型相关…
招聘城市:北京
…代码自验证生成、AI SWE等方向,能够将最新代码数据相关的研究成果快速转化为业务价值。
岗位要求:
1.计算机科学、软件工程、人工智能或相关专业硕士及以上学历,具备模型数据工程或Code LLM等实际项目经验;
2.深入理解 Transformer 架构及语言模型训练原理,具备丰富的数据处理经验。能针对Code SFT、代码偏好对齐等训练场景,设计高标准数据方案,有项目实战经验;
3.深入实践过 CodeAct、SWE-agent、LATS、AlphaCode等前沿代码推理与自动化框架者优先;
4.熟练掌握 Python,善于利用 Cursor、Claude Code 等 AI 辅助工具提升数据生产与自动化分析效率。熟悉至少一门其他主流编程语言(C++/Java/Go等),熟悉Docker优先;
5.在前沿会议有高质量论文…
招聘城市:深圳
…负责语音/音频模型研发,包括语音对话(语音交互/音视频对话)、音频理解(ASR/音频caption)、音频生成(TTS/视频配音)等模型研发;
2.负责语音/音频模型的预训练训练、强化学习(文本和音频强化)相关的数据算法工作;
3.负责语音对话/音频理解/音频生成的模型开源以及产品落地(比如语音对话产品全链路端到端优化、音频理解在噪音/口音/远场/音效音乐场景的优化、语音合成在播报/闲聊/游戏/社交等场景的优化)。
岗位要求:
1.有语音对话、语音合成、语音识别、音视频多模态、语言模型(预训练、微调、强化学习)等相关经验者优先;
2.优秀的代码能力、数据结构和算法功底,熟练掌握Python或C/C++,熟悉Pytorch/Megatron/DeepSpeed等模型训练框架,有ACM…
招聘城市:深圳
岗位职责:
1.负责语音/音频模型研发,包括音频理解(ASR/音频caption)、音视频理解等模型研发;
2.负责预训练训练、强化学习(文本和音频强化)相关的数据算法、评测工作;
3.负责音频理解/ASR模型开源以及产品落地(比如产品全链路端到端优化、音频理解在噪音/口音/远场/音效音乐场景的优化)。
岗位要求:
1.有语音识别、音频理解、音乐理解等相关经验者优先;
2.有音视频多模态、语言模型(预训练、微调、强化学习)等相关经验者优先;
3.优秀的代码能力、数据结构和算法功底,熟练掌握Python,熟悉Pytorch/Megatron/FSDP等模型训练框架、熟悉SLIME/VERL等RL框架优先;
4.有ACM/ICPC、NOI/IOI、Top Coder、Kaggle等比赛获奖者优先;
5.在相关顶级会议…
招聘城市:北京
…化交付体系,理解镜像构建优化、依赖隔离、网络/存储、制品/镜像仓库等能力,并能设计可复现的环境交付流程;
3.熟悉 Kubernetes 使用与排障,能在集群环境下完成部署治理、资源配置和稳定性问题定位;
4.有端服务、数据平台、任务平台、机器学习平台或评测平台相关研发经验;
5.理解数据集管理中的版本、信息、质量校验、权限、可追踪性和自动化流程,具备良好的数据建模能力;
6.具备强问题分析与闭环能力,能高效利用 AI 工具提升研发效率,并能与算法和平台团队协作推进落地。
加分项:
1.熟悉强化学习、Eval、Benchmark、Agent 任务数据模型训练数据流程;
2.具备跨语言协作能力,能借助 AI 工具阅读和维护 TypeScript / Rust / Go 代码。
招聘城市:深圳
数据管理、结果分析等核心系统,保障平台稳定性与可扩展性;
3.构建自动化评测流水线,提升评测效率与研发迭代速度;
4.与算法、产品团队紧密协作,理解评测需求并转化为可落地的技术方案。
岗位要求:
1.本科及以上学历,计算机相关专业,5 年以上端开发经验;
2.扎实的系统设计能力,有复杂业务系统或平台型产品的架构经验;
3.熟练掌握 Python/Go 等至少一门语言,熟悉常用框架与中间件;
4.熟悉分布式系统、任务调度、消息队列等技术,有高并发系统开发经验;
5.良好的沟通与协作能力,能够推动跨团队合作。
加分项:
1.有 MLOps/LLMOps 平台建设经验,熟悉模型训练、推理、评估等流程;
2.熟悉模型评测方法论,了解…
招聘城市:北京
…3.熟悉主流对话模型(如GPT4o、GLM-4-Voice、Qwen2.5-Omni、Voila等),有相关项目实践经验者优先;
4.熟练掌握PyTorch等深度学习框架,有模型训练框架Megatron/Deepspeed实践经验者优先;
5.熟悉模型相关结构设计及原理,有大规模预训练训练经验者优先。
部门介绍:
腾讯AI Lab是腾讯的公司级AI实验室,于2016年4月在深圳成立。借助腾讯丰富应用场景、数据、计算力及一流人才方面的长期积累,AI Lab立足未来,开放合作,致力于不断提升AI的认知、决策与创造力,向“Make AI Everywhere”的愿景迈步。 腾讯AI Lab强调研究与应用并重发展,基础研究关注机器学习、计算机视觉、语音技术及自然语言处理等四大方向,780…
招聘城市:西安

4.结合腾讯云星脉高性能网络、向量数据库等底层技术,优化AI任务的全链路性能,降低训练与推理延迟;
5.参与AI模型(如模型)的工程化落地,提供分布式训练框架支持,解决模型部署中的性能瓶颈与资源管理问题1;
6.探索AI与云原生技术的结合,推动模型量化、动态批处理(Continuous Batching)等前沿技术的应用;
7.与算法团队、产品团队紧密协作,输出标准化API与开发者工具,提升平台易用性;
8.参与行业生态共建,推动AI平台在金融、游戏、泛娱乐等场景的规模化落地。
岗位要求:
1.精通Golang开发,熟悉C/C++、Python等语言,具备3年以上端开发经验;
2.深入理解Kubernetes架构,有大规模集群管理经验…
招聘城市:北京
…ASR、声学前处理、自然语言处理、多模态模型等AI系统的工程开发(包括训练工具和推理引擎的开发、优化、交付等);
2.负责AI系统最新算法的集成、工程化、实际场景效果验证、优化、上线;
3.负责AI相关业务、产品的工程支持,在效果和性能上更好的落地。
岗位要求:
1.本科及以上学历,计算机相关专业,本科毕业有5年以上工作+学习的经验;
2.全面的计算机体系相关知识、基础扎实,有较好的数据结构基&算法基础,具备良好的思维逻辑;
3.精通c/c++/python语言,熟悉golang语言更佳;
4.优秀的分析与解决问题的能力,良好的沟通与团队合作能力;
5.具备一定的分布式系统、微服务架构、数据库技术、缓存技术、消息队列…
招聘城市:北京
平台核心架构设计与迭代开发,聚焦模型训练、推理、评估、数据多个核心场景,解决大规模训练数据处理、评测等场景问题,持续提升模型训练稳定性与平台整体性能上限;
2.LLMOps工程体系迭代与研发效能升级:持续深耕并跟进业界AIGC、模型工程化前沿技术与落地实践,结合内部模型训练训练、迭代、部署全流程诉求,持续优化平台技术方案与产品形态。聚焦平台易用性、自动化、标准化建设,降低模型研发与落地门槛,持续完善、升级、落地全链路LLMOps研发体系。
岗位要求:
1.本科及以上学历,具备扎实的AI工程化、模型研发底座技术功底,熟练掌握 PyTorch/TensorFlow/DeepSpeed 等主流深度学习框架,拥有真实落地的模型训练优化、分布式训练模型
招聘城市:深圳
…负责语言模型在AI原生搜索引擎上的优化和落地;
2.建设AI原生搜索系统,包括模型在内容理解、召回、排序、时效性、权威性、query分析等模块的应用落地;
3.调研业界前沿算法,包括模型引用预估、搜索领域训练、LLM for ranking&retrieval,Listwise/setwise ranking等前沿技术在搜索引擎理的研究和应用;
4.参与产品讨论,基于技术对产品提出改进建议。
岗位要求:
1.有语言模型应用经验优先,包括精调(SFT)、强化(GRPO)等技术的落地;
2.有RAG或LLM Agent的应用落地经验者优先;
3.熟悉搜索系统模块,有内容理解、召回、排序、时效性、权威性、query分析等落地经验优先;
4.熟悉TensorFlow,Keras,Pytorch等常规深度学习框架;
5.熟悉自然语言处理方向…